چرا تستهای مدرن منابع انسانی شکست میخورند؟
نقش جدید هوش مصنوعی در استخدام نیرو
نویسنده این مقاله، اندکی احتیاط را توصیه میکند. من آدریان فرنهام (Adrian Furnham) هستم؛ یک استاد روانشناسی دانشگاه با علاقهای دیرپا به آزمونهای روانسنجی و هوشآزمایی. کتابهایی در این باره منتشر کردهام (آخرین سالهای گذشته The latest last years، ۲۰ راه برای ارزیابی پرسنل Twenty ways to assess personnel، انتشارات دانشگاه کمبریج Cambridge university press)و تعدادی تست به ناشران تستهای روانشناسی فروختهام (از جمله شاخص سنجش افراد مستعد High Potential Trait Indicator).
طی سه سال گذشته، تعدادی کارآفرین جوان با من تماس گرفتهاند تا برای طراحی و معرفی تستهای روانشناسی جدید کمک بگیرند. آنها میخواستند یکی از پیشگامان نسل نوین استعدادیابی و مدیریت استعدادها از طریق هوش مصنوعی باشند. آنها کسبوکارها و استارتآپهایی کوچک بودند؛ برخی با پشتوانه قوی و برخی نه.
آنها شباهتهای بسیاری با یکدیگر داشتند. تا آنجا که متوجه شدهام، همه آنها از منظر مالی شکست خوردند؛ مانند بسیاری از استارتآپهای فناوریمحور حوزه آزمون و تست. یکی از مهمترین ایرادات کارشان آن بود که باید از نظر مقیاسپذیری، تجربه کاری و زمان و هزینه با فعالان سنتی بازار تستهای روانشناسی و منابع انسانی رقابت میکردند و با این حال اهمیت اعتبار، تمایل کسبوکارها و طراحی الگوریتمهایی برای متناسبسازی آزمونها با نیازهای هر کسبوکار را مورد توجه کافی قرار نمیدادند.
تخریب خلاق
در بیش از ۵۰ سال گذشته، «مدل» نشر آزمونهای روانشناسی و منابع انسانی به این شکل بوده است: در گام نخست، متخصصان و شخصیتهای دانشگاهی خوشایده یا نظریهپرداز اقدام به طراحی آزمونها میکردند. اغلب این آزمونها برای سنجش شخصیت، انگیزش و ارزشهای افراد بوده است. به عنوان مثال، تست شخصیتشناسی ۱۶گانه امبیتیآی (MBTI) را در نظر بگیرید که گفته میشود در حال حاضر در هر ۱۰ثانیه یک نفر در گوشهای از جهان آن را انجام میدهد. ناشران این آزمونها که ممکن است بسیار فرهیخته و علاقهمند به فناوری باشند یا نباشند، تستهای خود را در اختیار نهادها، شرکتها و مشاوران روانشناسی و مدیریت قرار میدهند. این آزمونها به نوبه خود به روشهای مختلف و اغلب در فرآیند شناسایی و استخدام استعدادهای بازار کار استفاده میشوند. طی ۲۰ سال گذشته، آزمونهایی که ابتدا کاغذمحور بودند، به تدریج به صورت آنلاین و الکترونیکی برگزار شدهاند. با این حال، مدل و سوالات آنها تغییر خاصی نکرده است.
حق استفاده از این آزمونهای روانشناسی و منابع انسانی «آبباریکهای» برای تعداد محدود ناشران تست بوده است. آنها یک انحصار کوچک چندقطبی در سطح جهانی دارند و از وضعیت موجود و درآمدهای اندک حاصله راضی هستند. طی سالهای مختلف، گاه شاهد افزایش علاقه به تستهای روانشناسی بودهایم و گاهی میزان تبوتاب جامعه جهانی کاهش یافته است. با این حال و به طور کلی، رسانههای اجتماعی اغلب به افزایش علاقه عموم به آزمونها کمک کرده است. شرکتهای بزرگ آمریکایی ناشر تستهای روانشناسی، بر بازار سلطه دارند. بسیاری از آنها پس از گذشت ۵۰ تا ۷۰ سال از فعالیتشان، هنوز پابرجا هستند. سپس انقلاب هوش مصنوعی فرا رسید و مانند هر حوزهای در این زمینه نیز راهکارهای ساده و آماده مصرفی ارائه داد. هوش مصنوعی به دو روش آزمونهای روانشناسی را بهبود میبخشد: نخست از طریق یک موتور امتیازدهی ساده که به شکلی پویا الگوریتمها را ارتقا میدهد (برخلاف نظم ثابت پیشین) و همچنین با ایجاد رویکردی تجربیتر، صرفا بر اظهارات و گزارشهای فردی تکیه نمیکند؛ بلکه به بررسی اطلاعات مرتبط، تحلیل لحن و حالات چهره فرد در مصاحبهها، پردازش استفاده از زبان طبیعی و... میپردازد. شرکتها همچنین جذب ابزارهای بررسی رزومه افراد شدهاند. از طریق ابزارهای نوین آنها میتوانند متقاضیان شغلی دارای یک مهارت خاص یا دارای یک کلیدواژه در رزومه را از خیل انبوه رزومهها جدا کنند. همچنین میتوانند هوش مصنوعی را آموزش بدهند تا بر اساس ویژگیهای موفقترین کارکنان فعلی و گذشته، به متقاضیان جدید امتیاز بدهد یا آنها را رتبهبندی کند.
استارتآپهای کوچک
بهطور ویژه شاهد برانگیختگی کارآفرینان جوان توسط پتانسیل موجود هوش مصنوعی در طراحی و بهبود آزمونهای روانشناسی هستیم. پتانسیلهای هوش مصنوعی در حوزه آزمونها را میتوان به سهدسته مختلف تقسیم کرد. نخست، این امید در آنها وجود دارد که بتوان از طریق هوش مصنوعی به سطح بالاتری از کارآیی و علمی بودن فرآیند استعدادیابی رسید. با این انگیزه و هدف، منطقی است که از افراد بخواهیم در تستهای آنلاین شرکت کنند و با استفاده از خروجیها در یک الگوریتم هوشمند به نتایج دقیقتر، قابل اتکا، خالی از تبعیض و معتبر دست یابیم. از این طریق میتوان صرفا متقاضیان شغلی را قبول/ مردود اعلام کرد یا برای آنها امتیازدهی و رتبهبندی اعمال کرد. جهان دیجیتال اشتیاق فراوانی برای استفاده از چنین پتانسیلهایی دارد! دوم، این امید وجود داشته است که بتوان واسطهها و دلالهای آزمونهای روانشناسی را حذف کرد. از نگاه بسیاری از استارتآپها نیاز نیست که همچنان به ناشران تستهای روانشناسی، حق استفادهای بابت این محصولات ارائه کرد. آنها از یکطرف، سهمی از منافع و درآمدها دارند و البته حق دسترسی و کنترل بسیاری از دادهها را پیدا میکنند. در برخی موارد نیز از معرفی و ارائه آموزشهای «ضروری» کسب درآمد میکنند. مشاوران شخصی و مدیریتی امروزه میتوانند خودشان تستهای روانشناسی را طراحی کرده و آنها را به دیگر مشاوران بفروشند یا حتی به طور مستقیم در اختیار شرکتها و کسبوکارها قرار دهند. از طرف دیگر، بسیاری از مردم علاقهمند به افزایش شناختشان از خود و دوستانشان هستند که خود میتواند یک بازار بالقوه جدید و بسیار بزرگ برای آزمونهای روانشناسی و شخصیتشناسی باشد. حال و هوای رسانههای اجتماعی نیز احتمال شکلگیری و رشد چنین بازاری را تایید میکند. مورد سوم این است که تستها را میتوان از طریق گوشی همراه یا حتی ساعتهای هوشمند انجام داد.
در حقیقت، این ابزارها مزیت جمعآوری دادههای رفتاری کاربر را هم دارند و میتوانند به عنوان مکملی برای سنجش شخصیت و پتانسیلهای فرد استفاده شوند. پنج سال قبل، یکی از دوستانم که بزرگترین شرکت نشر تست بریتانیا را بنیانگذاری کرد، خردمندانه موارد زیر را پیشبینی کرده بود: خدمات روانسنجی و هوشآزمایی باکیفیت به طور مستقیم به مصرفکنندگان فروخته خواهد شد. پیشرفتهای علم عصبشناسی مشخص خواهد کرد که مهمترین و معتبرترین تفاوتهای فردی چیست و چگونه میتوان آن را اندازهگیری کرد. جنبش مدالهای دیجیتال به همراه استفاده از بزرگدادهها و رزومههای دیجیتال، امکان فیلتر و غربال سریع رزومهها را فراهم میسازد.
شالوده توسعه کارکنان در آینده نزدیک بر دادههای حاصل از ابزارهای پوشیدنی قرار خواهد گرفت و نه آزمونهای روانسنجی. جهان شجاع و جدید در آستانه ظهور قرار دارد. روشهای مبتنی بر هوشمصنوعی، بازار را برای «ارزیابی» توسعه خواهد داد و روشهای سنتی یک بازار بسیار گوشهای باقی خواهد ماند. همچنان روشهای ارزیابی سنتی کارکنان، از نظر بازخورد برای توسعه، خودآگاهی، مربیگری و انتخاب رهبر سازمانی عملکرد بهتری دارند ولی این وضعیت میتواند به سرعت تغییر کند.
در حال حاضر از طریق هوش مصنوعی میتوان به عنوان مثال، شخصیت فرد را طی گفتهها و حتی سکوتش در جلسات آنلاین بررسی کرد و از آن برای بسیاری از برنامههای آموزش و توسعه بهره برد. همچنین به جای ارزیابی عملکرد ۳۶۰ درجه میتوان از شبیهسازیهای کامپیوتری استفاده کرد. بسیاری از کارآفرینان جوان به ناگاه متوجه فرصت بزرگ موجود برای ارزشآفرینی و کسبدرآمد شدهاند. جهان تستهای روانشناسی به نظر مهیای تخریب فعال و دیجیتالی شدن است. همچنین بهنظر میرسد که کار بسیار ساده است.
تجربه من
گروههای مختلف کارآفرینانی که با من تماس گرفتند و از چهار کشور مختلف بودند، ویژگیهای مشابهی داشتند. همه گروهها متشکل از سه تا چهار مرد جوان مشتاق و اغلب بسیار باهوش (البته نه در همه موارد) بودند. آنها در مدارس کسبوکار یا کسبوکارهای مشاوره مدیریت با یکدیگر آشنا شده بودند. آنها باهوش، شیفته فناوری، بلندپرواز و ریسکپذیر بودند. همچنین بیشترشان سوابق موفقیت و کارآفرینی در حوزههای دیگر را داشتند، بسیار در مورد سرمایهگذاری مخاطرهپذیر میدانستند و یک هدف واحد داشتند. همه با توجه به بازار بالقوه بسیار بزرگ پیشرویشان میخواستند ظرف چند سال از یک استارتآپ به شرکتی میلیاردی تبدیل شوند. برخی نسبت به بقیه اقدامات بهتری انجام داده بودند ولی همه آنها از رویه گرانقیمت، تنبل و غیرکارآی منابع انسانی و حوزه استخدام شرکتها شوکه شده بودند. در حقیقت، بسیاری از آنها ابتدا آینده خود را در حوزه منابع انسانی و مدیریت استعدادهای شرکتهای بزرگ تصور میکردند، ولی با مشاهده ضعفها به فکر راه چاره افتاده بودند. آنها در کمال شگفتی متوجه شده بودند که طی ۳۰ تا ۶۰ سال گذشته تعداد انگشتشماری تستهای استعدادیابی توسعه یافته است؛ شرکتها خواهان آزمونهای جدید هستند و البته میخواهند بدانند که کدام تستها دقیقتر از بقیه هستند. آنچه آنها قصد گفتنش را داشتند (و اغلب بدون شواهد کافی آن را بیان کردند)، این بود که آزمونهای جدید آنها توان روانسنجی و شخصیتسنجی بیشتری دارند. آنها بهویژه به توان پیشبینی و استعدادیابی آزمونهایشان مفتخر بودند؛ چرا که به دلیل رواج آنلاین آنها میشد مقیاس را به طرزی قابلتوجه گسترش داد، از تکرار و بازگشت برای وزندهی به سوالات استفاده کرد، همبستگی بین آزمونها را مشخص کرد و در نهایت دادههایی را مورد توجه قرار داد که پیشتر هرگز جمعآوری نمیشدند. کارآفرینان ما استدلال میکردند که آزمونهای آنها نقصها و مشکلات «روشهای قدیمی» از جمله مدیریت اثرگذاری (دروغگوییآزموندهندگان) را به شدت کاهش داده یا آنها را از ریشه حذف میکنند. ادعا میکردند که این هدف از طریق رسیدگی دائمی و طولانیمدت آزمونها
(بهعبارتی به دلیل مستمر بودن آنها) محقق خواهد شد. آنها همچنین ادعا میکردند که شرکتکنندگان در آزمونهای جدید تجربه کاربری عالی و علاقه زیادی به این آزمونها پیدا کردهاند. آنها در تلاش برای متقاعدسازی خریداران منابع انسانی بر قدرت پیشبینی آزمونهایشان، بهروز بودن و منصفانه بودن (بهویژه در دوران کنونی حساسیتهای اجتماعی نسبت به تبعیض) مانور میدادند. البته برای خریداران خود توضیح هم میدادند که از طریق استفاده از آزمونهای جدید، صرفههای اقتصادی از نظر زمان، حجم کار و هزینه هم نصیب آنها خواهد شد.
منابع انسانی شرکتها چه مزیتهای بیشتری میتوانستند توقع داشته باشند؟ کارآفرینان ما روی شعارهای بسیاری مانور میدادند؛ مانند نسل بعدی فناوری، نسل قرن ۲۱، واکاوی عمیقتر، متکی بر علم عصبشناسی، آخرین دستاورد روز، ضعفها و ایرادات کمتر، انتخابهای متنوعتر، اصیل و البته تخریب فعال. همه آنها به یک دلیل سراغ من آمده بودند: نام مرا در مقالات دانشگاهی، مقالات عمومی، سخنرانیها، کنفرانسها یا کارگاهها شنیده بودند. آنها میخواستند بدانند که آیا امکان طراحی آزمون برای آنها را دارم یا میتوانم توصیههایی برای کاربرد در کسب و کارها و انتخاب افرادی متناسب با هر سازمان ارائه کنم؟ خواهان آزمونهایی بودند که مناسبترین و همگنترین کارکنان برای هر سازمان (چه از نظر استعداد و چه از نظر ترجیحات شخصی) را شناسایی کند.
کجا اشتباه کردند؟
تا آنجا که میدانم، همه آنها شکست خوردند. یکی حتی ۲ میلیون دلار از پول سرمایهگذار خود را صرف کرد ولی به کشش و اصطکاک لازم برای ادامه مسیر دست نیافت. شکست همه آنها به دلایلی کلاسیک بود.
نخست، هزینه دستیابی به مشتریان بالقوه برای شروع به استفاده از راهکار دیجیتال خود را مشخص نکرده بودند. همراهسازی شرکتها برای استفاده از یک فناوری جدید به جای اصول و ساختارهای ریشهداری که طی دههها شکل گرفته، کار آسانی نیست. در حقیقت ریسک این کار برای شرکتها بسیار بیش از آن است که از طریق منافع فراوان بالقوه ترغیب شوند.
دوم، بیشتر کارآفرینان ما اطلاعات اندکی از کثرت تصمیمگیرندگان در فرآیند انتخاب کارکنان داشتند و هیچیک از آنها ایدهای در موردشیوه کار بازار راهکارهای منابع انسانی نداشتند. آنها غرق در امکانات و قدرت پیشبینی راهکارهایشان شده بودند و فراموش کردند خواستههای مشتریان خود را شناسایی کنند.
سوم و مهمتر از همه اینکه در شتاب خود برای تحقق رویاها و تخریب خلاق بازار، از جمعآوری شواهد واقعی اثربخش بودن راهکارهایشان غافل شدند. اصرار بر نتیجهبخش بودن آزمونها کافی نیست. جمعآوری توصیه از اساتید قدیمی یا مشتریان راضی کافی نیست. مشتریان به اندازه شور و اشتیاق، سند و مدرک هم میخواهند. افراد و شرکتها لیاقت این شواهد را دارند و حتی ممکن است دادگاه خواستار آن شود. زمانی که برایشان درباره شیوه اعتبارسنجی آزمونها و روش دریافت آن گفتم، برخی شوکه شدند.
برایشان توضیح دادم که طراحی دو مورد از آزمونهای روانشناسی که پیشتر به ناشران فروخته بودم، ساده بود ولی اعتبارسنجی آنها در دنیای واقعی بین ۳ تا ۵ سال زمان برده بود. موضوعی به نام مشکل محک (the criterion problem) وجود دارد که به معنای آزمودن ادعاها از طریق نتایج واقعی است. به عبارت دیگر، زمانی که یک آزمون، توصیه به انتخاب افرادی خاص از بین نامزدهای شغلی میکند، باید عملکرد واقعی فرد طی سالهای حضورش در شغل جدید او بررسی شود. سپس این عملکرد با پیشبینیهای آزمون سنجیده میشود تا اعتبار و دقت آن سنجیده شود.
همه آنها خود را با تبلیغاتشان فریب داده بودند؛ اینکه چگونه هوش مصنوعی میتواند و در واقع شیوه آزمونهای استخدامی را تغییر خواهد داد. همه آنها میپنداشتند که سنجش استعدادهای بازار کار مانند یک دریاچه راکد است و هر متخصص ماجراجویی میتواند با علم جذاب خویش، اقدام به تخریب خلاق آن کند.
منظور این مقاله آن نیست که برای تخریب خلاق یا نوآوری نکوشید. مشکل آن است که کارآفرینان اغلب از تجربیات دیگران نمیآموزند. آنها فکر میکردند که دلیل استفاده نکردن شرکتها از آزمونهای پیشنهادی آنها ناتوانی در دسترسی به متقاضیان است و البته حتی در همه موارد هم اغلب شکست خوردند. آنها در توسعه کسب و کارهایشان، حتی از هوش مصنوعی برای شناسایی چالشها و شکستهای مشابه دیگر کارآفرینان در خلال زمان استفاده نکردند.