奧推網

選單
娛樂

當機器人成為“面試官”

一個月內,圖圖完成了六場只有自己參加的面試。

點選面試郵件連結,對著鏡頭回答三到六個問題,總耗時不到20分鐘——這是AI面試(人工智慧面試)的流程。

面試結束後短短几分鐘內,一份百分制的成績單就和圖圖的簡歷繫結在一起,被遞交給負責招聘的HR。

彷彿是流水線上的產品,求職者在機器精密複雜的資料分析後,被打上“優秀”或“不優秀”的標籤。只有透過機器的面試,他們才有機會見上真人面試官。

不少求職者試圖“討好”機器人。有人精心準備面試題目庫,反覆背誦;有人事前錄下練習片段,學習調整表情和語音語調;有人在反覆試錯中摸索AI的“喜好”;還有人在不斷的失敗中自我懷疑。

李斯特為參加AI面試蒐集的題庫及回答。受訪者供圖

只有一個人的面試

支起平板電腦,點開郵件連結,圖圖端坐在書桌前,在跳轉頁面中完成了資訊確認和人臉識別驗證。

螢幕左側出現一個女性虛擬形象,短髮,身穿職業裝,手裡拿著紙和筆。她是這場面試的面試官,在正式開始前,虛擬人用電子合成聲,向圖圖介紹瞭如何錄製和作答時間等注意事項。

一共有三道題目。

第一道題目是自我介紹,虛擬面試官讀完題目後,圖圖有30秒時間來準備,作答時間為2分鐘。

按下錄製按鈕,圖圖需要把臉放置在螢幕裡提示的虛線框內,不能太高,也不能太低,如果超出這個區域,螢幕立馬會彈出提醒。

圖圖看著對面的“非人類面試官”,莫名的緊張撲面而來。

“我甚至最簡單的一句話都說不出來”,第一道題目圖圖就卡殼了,2分鐘的作答時間顯得無比漫長。

沉默中,她看著螢幕裡虛擬面試官仍在點頭,露出弧度不變的微笑,“感覺她在嘲諷我,我更說不出來了”。

圖圖覺得,在真人面試中能侃侃而談的自己不見了。

AI面試產品中的虛擬面試官。圖片來源:“多面”AI面試軟體截圖

在之前的實習面試中,她會觀察面試官的反應和表情,並據此有針對性的進行下一步的回答。表達中的停頓、表情、手勢,都可以幫助雙方的溝通。如果某句話沒有說好,圖圖會再重複一遍,繼續解釋她的意圖。

“但你知道AI不會理解你,”圖圖很無奈,“比如某一句話重複多了,不僅沒有得分還會減分。”

當“這是一場需要拿到高分的考試”壓倒“這是一場交流”時,壓力逐漸在瀰漫。

第二道題目是“談談公司未來的發展”。

螢幕上是倒計時,停頓的五六秒內,圖圖大腦裡一片空白,以及只有她自己能感覺到的尷尬。

沒有寒暄和問候,沒有互動和反饋,更沒有個性化的問題。不到15分鐘,圖圖秋招的第一場面試匆匆結束了,關掉攝像頭的她像一隻被放了氣的氣球。

圖圖就讀於上海一所大學,會計專業。第一次收到AI面試的郵件通知時,她並沒有在意這種形式,滿心以為“表達真實的自己就可以了”。

後來,圖圖在社交平臺上搜索“面經”時才知道,在她點選提交後,在短短几分鐘、甚至更短的時間內,負責該崗位招聘的面試官會收到一份評分報告。這份報告,是綜合分析她在錄製影片中的作答文字、表情、聲音等內容後得出的。

報告中的分數在該崗位全部求職者中的排名,決定著這次求職就此止步,還是進入下一輪。

在蘇州讀大學的葉子參與第一次AI面試時,做了“充足的準備”,但結果“可謂是慘敗”。

葉子根據網上的“面經”總結,AI面試的題目大多都類似“寶潔八大問”,比如你做過的最有成就感的事、你最挫敗的事、描述一次團隊合作的經歷、描述你如何制定了一個很高的目標,並且實現它等等。

由於準備時間較短,葉子耍了一個小聰明。她從網上整理了題庫,按照“寶潔八大問”STAR原則模板——在什麼情境(Situation)下,主要任務(Task)是什麼,做了哪些行動(Action),結果(Result)如何——寫好答案。然後在面試時把手機靠在螢幕旁,差不多照著讀了一遍。

猜對了題目,全程表達流暢,葉子覺得自己該講的點也都講到了。結果,成績讓她大跌眼鏡,只有61分,剛剛及格。

葉子開始反思自己的面試表現,並試圖在社交平臺上尋找“討好AI面試官”的經驗。

“是不是眼睛沒有直視攝像頭,總瞟手機螢幕會直接影響分數?是不是答題時間不足?是不是自己準備的案例比較複雜?不夠直白、口語化的表達,沒有踩到一些關鍵術語上?甚至我說了一些倒裝句,AI不能明白我的意思?”

她懷疑自己可能踩了雷區。“讀稿確實是作弊行為,人工智慧在分析答案上未必智慧,但在捕捉眼神、表情等方面應該很靈敏。”

但這些都只是葉子的猜測,“AI可以被討好嗎?誰能完全確定黑盒子裡的規則呢?”

只需要找到候選人中88%的精英就夠了

在招聘的另外一端,HR們的感受和龐大的求職者群體並不相同,他們更在意如何利用更高效的方式篩選出相對合適的候選人,AI面試就是這樣的選擇。

AI面試是指採用語音識別、影象識別等人工智慧技術對候選人進行面試,並對答案進行分析,然後根據職位所需的特質進行賦分,給出評分報告,篩選出得分較高的候選人,HR結合簡歷來判斷是否進行後續的面試。

2004年美國誕生全球首個AI影片面試領域的服務商,從2017年開始,國內陸續有研發AI影片面試的公司出現。

它被引入招聘面試環節,承擔著“初面”的功能,應用於在面向應屆畢業生(或實習生)的高競爭崗位,例如銀行、投資機構、頭部外企的校招。另外,AI面試也被用於銷售、導購、服務人員等崗位的招聘。

萬森是一家大型銀行總部的人力資源專家,他所在公司從2018年開始使用人工智慧輔助簡歷篩選,後續開始採購AI面試的服務。

在萬森看來,這種面試形式適用於有大量初篩需求的公司,對大型公司來說,初篩的效率對招聘進度的影響程度很大。

萬森算了一筆賬,以5分鐘的影片為例,人工觀看最快也要2分鐘,人工智慧則可以在10秒內完成資料分析。

而“快速篩選、降低成本”,也是市面上主流的 AI 面試產品的核心賣點。

根據多位HR介紹,一次傳統面試的時間大約需要30分鐘。而獵聘網旗下的“多面AI面試”可以幫助3名面試官在48小時內完成5000人的初篩面試。近嶼智慧的“AI得賢招聘官”,在小規模的面試場景中,可為人類面試官節省至少65%的面試時間。以100份簡歷錄取2人的場景為例,使用AI面試後,招聘時間從2220分鐘縮短至507分鐘,效率提升約4。5倍。

那麼,一場AI面試是如何開始的?

在招聘開始前,萬森會根據公司需求,確定每個崗位候選人需要考核的能力。

以銷售崗位為例,萬森希望找到性格活潑、能說會道的候選人,如果有對外業務,會希望候選人有優秀的外語能力。因此他會注重人際交往能力、市場洞察力、性格特徵等幾個方面。

在每個AI面試產品的後臺,都有許多常見的勝任力模型供選擇,例如溝通能力、執行力、邏輯思維、創新能力、內驅力等幾十種,而每一種能力後面都有推薦的面試題目。

某平臺釋出的AI模擬面試題。圖片來源:網路截圖

這意味著,每一個職位所需要的技能,都需要被標準量化。比如“請結合實際經歷,談談你是如何在新環境中融入團隊並適應學習或工作的”,關注的是候選人的“抗壓能力”和“學習反思”能力。

近嶼智慧CEO方小雷認為,勝任力模型是目前人力資源領域最科學和底層的基礎方法,這些維度和標籤是根據企業諮詢和真實面試案例梳理制定,據此制定AI面試考察的方向。

除了配置某個崗位需要考核的能力,萬森還會根據不同能力的重要性來調整不同的分數佔比。

當崗位的素質模型確定後,在內部測試中,萬森所在的部門會向該模型輸入去年收到的簡歷及面試影片,標註已錄取的候選人,“讓機器去學習我們的喜好, 告訴它回答到哪些方面能拿到高分。”

而求職者在AI面試得分的高低,就取決於和模型的相似程度。

萬森介紹,讀取語言部分的資訊,只是人工智慧收集的一部分資訊,影片中非語言資訊也會成為判分的依據。例如,人工智慧可以根據談話的語速、語調來判斷性格特徵;或是根據面部表情來判斷情緒。

在全部面試完成後,萬森所在的部門會人工觀看每一個崗位面試評分的前十名和後十名。透過對比機器和人工的評分結果,一旦出現嚴重不匹配的情況,該崗位會重新進行測評,但他說“目前還沒出現重測”。

從面試結果上看,AI面試沒有淘汰人,只是給出了建議,最後依舊是人工選擇進入下一輪面試的人選。但據多位HR反映,他們不會看所有的影片,會直接淘汰排名靠後的人選。

“會有遺珠,肯定是有一些優秀的人沒辦法透過AI篩選出來”,但萬森也承認人事部門不會為此花上幾百個小時去尋找,他們只需要找到這一批候選人中88%的精英就夠了。

把自己當成“機器人”

求職者們在不斷失敗中反思自己,也在各大社交平臺上搜尋“討好AI秘笈”。

葉子為第二次AI面試做了更加充足的準備,這是一家頭部快消公司的管培生崗位。

葉子錄下了練習影片,發現自己面對鏡頭時表情很拘謹,不自然,眼神經常飄去其他地方;遇到卡殼時會有小動作,聲音顫抖。

為此她早早預約了圖書館的研討室,葉子把自己準備的答案背得滾瓜爛熟,做好表情管理,練習語速流暢,以及讓聲音保持飽滿的感情,還對著鏡子練習了微笑。

和葉子一樣,李斯特也在失敗中不斷自我懷疑。

李斯特是英國一所大學的市場營銷專業碩士研究生,她的秋招開始得更早,求職方向是快消外企、奢飾品、零售和地產方向。8月3日,她投遞了第一份簡歷。截至目前,她參加了15場AI面試,通過了5場。

李斯特的秋招投遞表格。受訪者供圖

11月1日下午參加的那場奢飾品行業的AI面試,讓李斯特摸索出一個簡單且重要的結論,這可能也是她之前10次都失敗的原因。

“盯著手機攝像頭亮起的綠點。”

當天晚上快九點,李斯特收到了AI面試產品平臺工作人員的電話,詢問她有沒有時間參加第二天的群面,並告知她的AI面試得分特別高,求職公司的HR希望能夠儘早見到她。

“我之前所有說的內容都是差不多的,結構化面試的題目是很相似的,唯一的區別就在於我那一次死盯著綠色的點,而之前都是看螢幕中的自己。”

這是李斯特前一天在AI面試技巧帖子的評論區中看到的,有網友說自己做了這樣的測試。“沒有任何官方資訊告訴我們眼睛盯著的地方對整體分數影響,所以導致前面很多家公司我沒有與真人溝通的機會了。”

一開始,李斯特嘗試跟機器人聊天。“因為招聘的公司不會完全承認自己只看測評分數,部分HR說他們真的會看內容的,我早期抱著幻想。”

她試圖把對面當成真人,用一些輕鬆的語氣開一些玩笑,以及口語化的表達。但遲遲沒有下一輪通知,讓李斯特意識到這樣不行,“分數不夠高,HR看不見你。”

把自己當成“機器人”,去迎合人工智慧的評分標準,李斯特開始嘗試用機器化的方式去回答問題。

比如AI面試官問,“舉例說明面對複雜問題時,如何定位關鍵點並找出解決方案。”

李斯特能夠識別出這是想要考察解決問題的能力。在真人面前,她會直接從亮點說起,然後根據面試官的興趣展現自己的能力。在AI面試中,李斯特只能按照時間線的順序回答。“第一件事是梳理資源,第二件事是展開調查,第三是把已有資源量化,第四呈現具體方案。”她感覺自己逐漸從一個立體的人變成了平面的人。

一切都以機器的喜好為先,但有時候李斯特搞不清楚機器喜歡什麼。比如當AI面試官問,“當你需要嚴格按照一個政策或規定,而這個規定對你來講是不方便的,你會怎麼做?”

如果在跟真人聊,李斯特會強調自己的靈活性,既尊重這個規則,但也會很靈活的去處理。但在面對AI的時候,“我不確定AI是更注重我的靈活性,還是更注重我是不是一個守規則的人。”

演算法的判斷可靠嗎?

事實上,AI面試官的“能力”取決於多種因素,不同公司的演算法邏輯也不盡相同。

一位人工智慧領域的專家認為,目前AI面試產品並不是一個成型的行業,只是人工智慧應用的一個場景,因此缺乏統一的行業標準,更多是根據客戶的需求進行開發,“比如有的需要題庫多,有的需要靈活,誰說了算?誰說了也不算”。

在“多面AI面試”中,市場部負責人葉小舟介紹,決定結果有效性的主要有兩點:首先是構建資料模型時,機器學習的輸入資料量和其有效性,其次是人類面試官對結果反饋的準確性。多面AI面試是學習人類面試官判定規則,如果人類面試的結果不準確,那多面AI面試結果的有效性就無法保證。

而在“AI得賢招聘官”中,AI面試官的語義分析水平,決定著對候選人回答內容的解析準確度。近嶼智慧CEO方小雷解釋,就是讓人工智慧理解話語,理解“一個句子放在一句段話中的意思”。

如果AI面試產品處於“關鍵詞分析演算法”階段,透過提取候選人回答文字中的關鍵詞,來評判候選人回答問題的好壞,方小雷認為面試結果“會產生誤判”。“(某個回答)堆砌很多詞藻,命中很多關鍵詞,但它是言之無物的,演算法用一個加減乘除的公式表達,這種時候分數都是會出現問題。”

在方小雷看來,只有達到“篇章級別的理解”的程度,才能說AI面試的結果是有效的。簡單來說,“篇章級別的語義識別演算法”就是讓人工智慧理解“一個句子放在一句段話中的意思”。

AI面試影片中的語義、語音和麵孔影象是三種完全不同的訊號源。除了對候選人的回答內容進行分析,AI面試還會對求職者的表情、聲音等非語言部分進行分析。

但方小雷稱,AI面試產品很難識別微表情。他認為,目前心理學上對微表情的研究並不充分。比如一個人的眼睛朝左看一下是在回憶,但也有大量的人在想象時,眼球也會向左轉動,因此不能作為判斷的標準來訓練機器。他說現階段表情識別只做到“宏表情”,也即判斷開心、悲傷、憤怒、厭惡、恐懼等幾種明確的表情。

“命中率”高,也即同一個候選人的人工評分和機器評分的一致性高,是大部分AI面試產品用來評估有效性的方法。市面主流的AI面試產品官方資料顯示,人工智慧面試官的篩選出來的結果相對準確。比如“多面AI面試”的判斷結果與人工判斷結果的吻合率達90%以上。在大規模的面試場景中,近嶼智慧的“AI得賢招聘官”的正確性遠超人類面試官的平均水平。“海納招聘AI面試”則聲稱精準度高達98%。

上述人工智慧專家提到,“機器學習不管過程”。即使作為開發者,也只能從結果推論出求職者大概怎樣做才能取得高分,但他也無從得知求職者說出哪些關鍵詞必定會加分;或者要以怎樣的語速和語調,或保持怎樣的表情神態作答才能滿足AI的要求——因為AI評分是連同用字及表情等多個專案分析得來的結果,並非如語速適中就會加分般簡單。

這背後是AI深度學習模仿人類的神經網路,當中牽涉龐大的複雜計算。香港中文大學計算機科學與工程學系系主任金國慶教授曾在接受採訪時形容,深度學習的過程就像人類學習踏單車,雖然不能描述出如何保持單車平衡,但只知道反覆練習便能學會這項技能。

AI面試官的學習方式就是,收集大量的候選人樣本資料,並人工標註打分,將其輸入機器。系統學習了經人類分析的資料後,會自動把新輸入的資料(面試片段中求職者表現)和結果(反映出的性格)聯絡起來,比如一些使用一些積極的詞彙,代表著候選人的性格積極等。

在萬森看來,AI面試存在著明顯的優點。比如機器的統一標準能規避人類面試官的主觀性判斷。萬森曾做過一項研究發現,面試官更傾向於錄取與自己同校的候選人。而當面試官精力有限,比如工作了4小時或更長時間以後會出現“疲勞審視”,也會影響對候選人的判斷。

方小雷也認為,AI面試的高效率可以給所有候選人一個公平的機會。如果一個崗位收到了1000份簡歷,可能真人面試官在面試100人裡面就已經找到了合適的,這意味著後面900個人會被自動淘汰。

但萬森也承認,“AI很明顯還沒有達到人的智慧”。初篩需要完成的是求職者的特質和崗位之間的初步磨合,因此他們不會在這個環節問很複雜的場景式問題。

不是所有的崗位都適合AI面試。萬森曾經遇到過一些非常優秀的程式設計師,由於不善言辭,在AI面試中的評分很低。他所在的公司經過權衡後,技術類崗位由筆試進行初篩,“畢竟AI不能幫你解決所有事。”

這個看起來更省事、更加公平的工具也讓一些HR充滿困惑。

宋威是一家第三方人力資源公司的專案經理,曾為某公司招聘大量客服人員,在他看來,人工智慧也許可以篩選出表達和溝通能力良好的人,但是沒辦法對候選人的態度進行判斷。

另外,他還擔憂,AI面試可以判斷一個人的綜合能力,但它可能無法感知一個人的內心世界以及最深的人生動力。

AI會改變我們嗎

“在系統中翻滾”,圖圖這樣形容她的秋招。參加AI面試的同學們大多有這樣一種感覺:求職的人就像一批產品在流水線中迴圈,僅憑系統根據複雜的計算篩選出標準化產品。

而當AI面試重複太多次,“結構化面試的一套答案就會成為肌肉記憶”,大腦一聽到關鍵詞就形成條件反射。

AI面試強調一致性而非多元化。李斯特覺得,所有應屆生進入職場的過程,就像公司在篩選最適合的工具的過程,而且大部分公司都是隻需要螺絲釘的,它不需要個人的。AI面試中確定的崗位特質標籤,李斯特認為更應該是一種偏好,而不是一種標準,但當對方拒絕溝通時,她就沒有辦法輸入個性化的東西。

“思維僵化”,當李斯特的AI面試和真人面試同時進行時,她很明顯地感受到這一點。

那是一個汽車公司市場崗位的最後一輪面試,面試官為崗位所屬事業部的HR,面試官的提問恰好也類似“寶潔八大問”。李斯特幾乎迅速地搬出應對AI面試官的那一套框架來,就像背答案一樣。

有博主在社交平臺上分享關於寶潔公司的面試方法。圖片來源:網路截圖

最後李斯特被拒了,該公司的反饋是覺得她對這個行業不夠熱情。

面試者需要花費很大的力氣,付出很大的勇氣,才敢把話語權拉回到自己這一邊。“可能只有經歷了個人成長,內心更加堅定強大,更加抗衝擊時,才敢於去做雙向選擇,才會敢於主動丟掉跟自己不匹配的公司。”

“求職中一個很殘酷的事實是面試者其實處在比較弱勢的位置,”萬森曾提到了他在社交媒體上做職場面試博主的初衷。

他常常分享自己作為面試官,提出問題時到底想了解的是什麼,希望幫助同學們更好的理解面試官,彌補上雙方之間的不瞭解。

萬森遇到過抱怨吐槽AI面試冷酷無情的求職者,他總是勸同學們調整心態,把它當作遊戲中闖關打boss。

至於如何提前做準備,葉小舟提到多面研發了模擬訓練間,並蒐集了大廠題庫提供給學生練習,希望幫助他們提前適應面試環境。

相比之下,李斯特更喜歡一些允許充分表達自己性格的公司。

高分透過那場奢飾品行業的AI面試後,李斯特進入了下面的流程,線上下面試中再次條件反射般準備“輸出一套結構化答案”。

她驚喜地聽到面試官明確表達“我不想聽,我對這個不感興趣”,並告訴她“就是想正常的聊一聊,看看合不合我眼緣。”

“放飛地去聊天”,李斯特當即決定。

兩人聊了做這個工作最關鍵的三個點和如何看待某一種工作,猜測某家店的營業額。“我回答問題的方式變成了他洞察我思維方式的手段,回答的內容變成了判斷我業務能力的素材”。

最後這場面試,李斯特當場透過。

新京報記者 李聰 編輯 陳曉舒 校對 李立軍