Моделирование процессов подбора и оценки персонала (1142477), страница 15
Текст из файла (страница 15)
Работу Вы получитепосле интервью с представителем компании. Для того чтобы получитьвозможность пройти интервью, необходимо отправить в компанию резюме ссопроводительным письмом.Обязательно проверьте правильное написание слов! (Два разапроверьте резюме сами, а затем попросите своих друзей и родных проверить его).В резюме Вы должны представить себя с лучшей стороны, однакоизбегайте преувеличений.Оставляйте достаточно места между параграфами, чтобы резюме невыглядело перегруженным.Используйте шрифт Times New Roman, 12-й размер.Вы не обязаны указывать в резюме свой возраст или семейноеположение.Выровняйте по центру параграф, который содержит Ваши личныеданные.Выделите жирным шрифтом оглавление каждого параграфа (цели,образование, навыки и т.
д.), используйте заглавные буквы.Выделите название своей должности на предыдущем месте работыжирным шрифтом. Укажите, если эта должность была временной.Указывая период, когда Вы работали в данной должности, используйтемесяц и год (январь 1997 — апрель 1999).Описывая свой опыт, начинайте с последнего места работы или, еслиВы работаете, с Вашей настоящей работы.Имейте в виду, что вся информация, указанная Вами в резюме, можетбыть проверена Вашим будущим работодателем или компанией по подборуперсонала.Несмотря на то, что все резюме не могут быть заполнены абсолютноодинаковым образом, из вышесказанного можно сделать вывод о том, какаяинформация будет присутствовать в резюме практически наверняка.
В данном76исследовании автором предложен следующий набор факторов и измерительныхшкал для них, которые можно извлечь из резюме.1) Пол кандидата (1 – мужской, 2 - женский).2) Возраст (в годах).3) Наличие высшего образования (0 – не указано, 1 – указано).4) Профиль (1 – гуманитарный, 2 – технический).5) Стаж работника (в годах).6) Количество организаций, в которых работал кандидат.7) Перечисленные обязанности (количество).8) Знание английского языка (0 – не указано, 1 – указано).9) Другие иностранные языки, указанные в резюме (0 – не указаны, 1 –указаны).10) Уровень знания компьютера (3-балльная шкала; 0 – не указан, 1 – знаниеMS Office, 2 – знание специализированных пакетов анализа Statistica, SAP и т. д., 3– навыки программирования).11) Уровень запрашиваемой заработной платы (0, если не указан).Как видно, в модель приходится включать довольно большое количествокачественных данных, которые показывают наличие или отсутствие того или иногопризнака у исследуемого объекта и могут иметь как номинальную, так и ранговую[25] (в случае с фактором № 10) шкалу измерений.
Наличие некоторых признакову исследуемого объекта отражается в моделях при помощи так называемых«фиктивных переменных» (манекенных переменных, dummy variable), которыепринимают только два значения – 0 и 1.При применении фиктивных переменных (индикаторов) в регрессионныхмоделях можно использовать два различных подхода [31, c. 60]:построить несколько моделей, отдельно для каждого значениякачественной переменной;учесть качественные переменные в одной модели.Также, в случае, когда количество градаций качественной переменнойпревышает два, существуют два пути включения качественной информации в77модель: создать шкалу значений для отражения качественного признака, либоввести несколько фиктивных переменных, число которых должно быть на единицуменьше, чем количество градаций изначальной переменной. В противном случаевозникаетситуация,переменных»[38,котораяс.118]получила(dummyназваниеvariabletrap)«ловушкиификтивныхозначаетналичиемультиколлинеарности.2.2 Модели бинарного выбораБинарная регрессия представляет зависимость эндогенной переменной,принимающей всего два значения – 0 и 1, от набора факторов.
Существуютограничения, связанные с использованием обычной линейной регрессии, так какпрогнозное значение должно попадать в отрезок [0; 1]. Данная проблема решаетсясиспользованиеминтегральныхфункцийраспределения.Чащевсегоиспользуются функции нормального распределения (пробит), логистическогораспределения (логит) и распределения Гомпертца (гомпит). От выбора функциираспределения напрямую зависит соответствие прогнозов, полученных с помощьюмодели, реальным данным.Предполагая, что зависимая переменная , которая представляет собойвозможность или невозможность взять на работу кандидата (или, в случае срекрутинговым агентством – рекомендовать его клиенту), принимает только двазначения: {0; 1}, вероятность того, что она примет соответствующее значениеможно выразить как функции некоторых факторов (2) и (3): ( = 1|) = ( ),(2) ( = 0|) = 1 − ( ).(3)Набор параметров отражает влияние изменения каждого фактора наконечную вероятность.
Задача состоит в том, чтобы подобрать адекватнуюфункцию в правой части уравнения.Одна из возможностей – использовать обыкновенную линейную регрессию(4):(, ) = .(4)78Поскольку[|] = 0[1 − (, ) + 1[(, ) = (, ),мыможемпостроить регрессионную модель (5): = + .(5)Линейная вероятностная модель имеет ряд недостатков, главный из них – то,что результат, полученный с помощью модели может выходить за границы отрезка[0;1].Естественно предположить следующие условия (6) и (7):lim ( = 1|) = 1,(6) ( = 1|) = 0.(7) →∞lim →−∞Впринципе,любаяинтегральнаяфункцияраспределениябудетудовлетворять данным условиям. Широкую известность в эконометрике приобрелатак называемая пробит-модель [45, c.77], использующая функцию (8) стандартногонормального распределения:() = Φ( ).( = |) = ∫(8)−∞Так же популярна логит-модель [46, c.47], использующая функцию (9)логистического распределения:exp( )( = |) == Λ( ).1 + exp( )(9)И гомпит-модель, использующая функцию распределения Гомпертца (10),так же имеющая название complimentary log log model, или просто cloglog[74, с.729]:( = |) = 1 − exp[− exp( )].Оценкапараметров осуществляетсяметодом(10)максимальногоправдоподобия [74, c.58].
Каждое наблюдение является схемой Бернулли, поэтомуфункция правдоподобия (11) предстает в виде:(1 = 1 , … = |) = ∏[1 − ( )] ∏ ( ). =0 =1(11)79Функцию правдоподобия для n наблюдений (12) можно переписать в виде[77, c.253]:1−(|) = ∏[( )] [1 − ( )].(12)=1Теперь запишем уравнения правдоподобия (13): −= ∑[+ (1 − )] = 0.(1 − ) (13)=1Поскольку данные уравнения являются нелинейными, они решаются спомощью численных методов, таких, как многомерная интерпретация методаНьютона (14): +1 = − −1 ( )( )(14)где - матрица Гессе.Особенность применения бинарной регрессии для оценки работниказаключается в необходимости дать количественную интерпретацию качественнымпеременным: образование, пол, навыки и др.
Опыт работы может включать в себятак же и оценку самих организаций, в которых работал кандидат, оценкудолжностей, которые он занимал и т.д.Показатели качества моделей бинарного выбора.Поскольку модели бинарного выбора являются нелинейными моделями, товоспользоваться обычным коэффициентом детерминации мы не можем. В случае,когда обычная линейная модель оценивается методом наименьших квадратов,коэффициент детерминации рассчитывается по формуле (15) [81, c.153]:2∑=1( − ̂) =1− 2∑=1( − ̅)2(15) +⋯+где ̂ = ̂1 1 + ⋯ + ̂ 1 , ̅ = 1. Если оценивать короткую модель(так же, используется термин «нулевая модель»), правая часть которой состоиттолько из константы, т.е. модель = 1 + 1 , = 1, … , , то для такой модели ̂1 =,̅ ̂ = ̂1 = ̅, так что 2 = 0. При добавлении в правую часть модели80дополнительных объясняющих переменных коэффициент 2 возрастает, и еговеличина будет зависеть от того, насколько более выраженной является линейнаясвязь объясняемой и объясняющих переменных.
Максимального значения 2 =1 коэффициент достигнет в предельном случае, когда для всех = 1, … , выполняются точные соотношения = 1 1 + ⋯ + .В случае с нелинейными моделями, одной из возможностей определить мерукачества подобранной модели является сравнение количества неправильныхпредсказаний, производимых длинной моделью, и предсказаний, получаемых помодели, в которой в качестве объясняющей переменной выступает толькоконстанта (тривиальная или короткая модель).Естественно было бы предсказывать значение = 1, если ( ̂) > 0,5, чтодлясимметричныхраспределенийравносильно ̂ > 0,следовательно,прогнозные значения (16) будут равны:1,если ̂ > 0,̂ = {0, если ̂ ≤ 0.(16)Количество неверных предсказаний модели (17) равно: = ∑| − ̂ | = ∑( − ̂ )2 ;=1(17)=1доля неправильных предсказаний рассчитывается по формуле (18): 1= ∑( − ̂ )2 .(18)=1В то же время, для короткой модели = 1 предсказывается для всех =1, … , , при ̂1 > 0,5, то есть, когда значения = 1 наблюдаются более, чем вполовине наблюдений.
Аналогично, значение = 0 предсказывается для всех =1, … , , когда ̂1 ≤ 0,5, то есть, когда значения = 1 появляются не более, чем вполовине наблюдений.Доля неправильных предсказаний (19) для короткой модели равна:1 − ,̅ если ̅ > 0,5, = {,̅ если ̅ ≤ 0,5.(19)81Тогда, в качестве показателя качества модели (20) можно использоватькоэффициент [75, c.98]:̃2 = 1 − .(20)Однако, в том случае, если длинная модель дает предсказание хуже, чемкороткая модель, такой коэффициент может, принять отрицательное значение. Также, стоит отметить, что количество неверных предсказаний осуществляемыхкороткой моделью не может превышать половины наблюдений.
А в том случае,если в выборке для 90% наблюдений = 1, то доля неверных предсказаний длякороткой модели будет равна 0.1, и для того, чтобы получить положительный ̃2 ,необходимо, чтобы длинная модель осуществляла более 90% правильныхпредсказаний. Это говорит о том, что большая доля верных предсказаний еще неговорит о качестве модели.Альтернативным подходом к построению аналога коэффициента 2 являетсясравнение максимумов функции правдоподобия для длинной и короткой модели.Обозначим максимум функции правдоподобия для длинной модели икороткой модели соответственно и .















