リクナビ,内定辞退率問題

例の話題のリクナビ問題.いろいろメモ

https://www.newsweekjapan.jp/reizei/2019/08/post-1106.php

ある人が就活の時期に、リクナビのサイトで各社のサイトを閲覧したとして、「内定が出て実際にその会社に就職した場合、その会社の閲覧パターン」「内定したが辞退した場合、その会社の閲覧パターン」などをAIを使って、つまり相当に大きなデータを統計処理する形で集めていったのでしょう。その上で、全体的なパターンを分析していったのだと思います。

報道では、非常に単純化して「内定を出した会社の側から見て、前年に辞退した学生が内定後にも他社サイトを閲覧していたデータ」などを分析してパターンを発見していったような説明がされています。

おそらくそれだけではないはずです。辞退された会社の側から見て、自社が内定を出す前に、とっくに内定が出ていて「そっちが本命だった」場合には、自社が内定を出した「後にまだ閲覧を続けていた」というケースには当てはまりません。むしろ、自社より先に内定していた会社が結局本命だったというケースの方が、もしかしたら大きいかもしれず、そうしたケースも漏らさずパターンとして認識していた可能性はあると思います。

リクルートキャリアや、このサービスを利用したと公表している企業は、このうちの後者、つまり辞退予測に基づいて不合格にしたケースはないとしています。ですが、内定者数全体の管理としては、辞退率を前提に「水増し内定」を行ったり、「現在内定を出しているグループから辞退が出ることを前提に、次善のグループには合否連絡を遅らせたり」するということはあったと思います。

ということは、やはりデータを見られて辞退率を計算された就活生本人以外を含めて、このような不正なデータ提供により、振り回された就活生は数多く存在したということが推測できます。

そもそもからして,「内定辞退率」なんて予想できるのかという本質的問題が.

採用に統計や深層学習を使うのは悪手だというのは,Amazonが断念したことからもわかる通り.リクナビの技術力がAmazonを遙かに凌駕していたとは,とても考えにくいのだけど.


男女差別の話もちろんだが,一年もすれば景気動向も企業の収益もガラリと変わってたりするし,去年取りすぎた企業は今年取らなかったりもする.昨年以前の古いデータなど,いったいどれだけ役に立つものだろうか.それこそ土地バブル崩壊リーマンショックの前後で,どれだけ求人動向が変化したか胸に手を当てて考えてみるがいい.


ましてリクナビが学生にとって不利な情報を提供していたとなると,翌年からはリクナビを使う時にダミーのアクセスもくり返すようになって,元となる行動データも歪むことになるかもしれない.*1


さらに困ったことに,この予測データが信頼され,これを元に多くの企業が行動するようになると,さらに結果が歪むという問題も発生する.株価予想で「この株が下がる」という予想が発表されれば本当に株価が下がるように.多くの投資家がそのニュースを信用して売りに出すことで少なくとも短期的には下がるし,それを分かってる人はデマだと分かっていても下がる前に売ろうとする(その後に底値で買い戻す.)のでさらに下がる.たとえその情報が,プログラムのバグが原因で出されたものであってもだ.

採用だって,これを利用される限り同様のことが起きるだろう.単純な例として,平凡なAさんと優秀なBさんの例を考えてみよう.Aさんは辞退率が低いから優先的に採用される.優秀なBさんはその逆.その結果Aさんは10社から内定をもらったので,内定辞退率90%..優秀なBさんは高い辞退率予測のために内定をもらうのに苦労し,ようやくもらった一社に決めたので辞退率0%.辞退率なんて内定を多くもらう人が高くなるんだから,当然そうなるのではないか? *2


ところで,既に内定辞退予想を利用していた企業では,はたして実際の的中率はどの程度だったのだろうか?そして仮に今は当たっていたとしても,それがいつまで続くだろうか. *3

「詳報・リクナビ問題 「内定辞退予測」なぜ始めた? 運営元社長が経緯を告白」

https://www.itmedia.co.jp/news/articles/1908/27/news062.html

18年3月から提供、19年3月からスキーム変更 「外資就活ドットコム」も関与、
 リクナビDMPフォローは「19年3月~7月末にかけて提供された」などと各所で報じられていたが、リクルートキャリアによると、同サービスをリリースしたのは18年3月。仕組みの検討は17年夏頃から始めていたという。

 リリース当初は廃止時点の仕様とは異なり、(1)顧客企業から、氏名やメールアドレスを伏せた形で応募者のCookie情報などを提供してもらう、(2)リクナビ保有するCookie情報と突き合わせ、応募者のブラウザを特定する、(3)アクセス履歴を過去のリクナビユーザーのものと照合し、内定辞退率を0.0~1.0のスコアで算出する――という流れだったとしている。

ただ、この分析手法では、応募者が異なる端末やブラウザを使い分けている場合に動向を追い切れないことから、仕組みの変更を決断。19年3月から(1)顧客企業から、応募者の個人情報(大学・学部・氏名)を提供してもらう、(2)リクナビ保有する情報と照合し、個人を特定する、(3)行動データを過去のリクナビユーザーのものと照合し、内定辞退率のスコアを算出する――という仕様に切り替えたという。


 こうしたビジネスモデルの同サービスは、リクルートキャリア内からの評価も高く、社内で表彰されたこともあったという。

「当社には、大学(のキャリアセンター)と接点を持っている部署がある。この部署がリクナビDMPフォローのことを事前に知っていたら、『(法的・倫理的に)良くない』という指摘は出てきただろう。だが実際は、この部署のレビューを経ることなくリリースしてしまった。リリース後もこの部署のスタッフは、当社がデータを利活用していることは知っていたはずだが、スコア算出の詳細は知らなかった」(小林社長)

法務部門くらいあるだろうに.チェックしてもらったら通らないことがわかりきっていたから,気づかなかったフリして見切り発車したのかな.

利用してる企業側だって,これがヤバイことくらい百も承知だったろうに.それとも,このくらいのことも知らずして,人事部が務まるんでしょうか?

「事業存続が問われるレベル」の危機、抜本的な改革を検討

*1:「内定辞退予想を外すために,第二志望以下の企業へも頻繁にアクセスして興味があることをアピールするようにしましょう」 「リクナビ内定辞退率予想へ完全対応!我が社のリクナビ代理アクセス サービスをご利用下さい。」

*2:ここのところが天気予報と株価の大きく違う所.全ての投資家が予想を信じて売買すれば,株価は簡単に操作できる.(だからあまり信用しないけど.)
しかし仮に天気予報を信じて人間がどのような行動を取ろうとも,気象への影響など微々たるものだ.台風が近づいてるという予報に合わせて全ての人間が外出を控えたからと言って、台風が消えたりはしないのだ.ヒートライランド現象や大規模な農業のようなものでやっと影響がある程度で,それですら短期的な天気予報への影響は小さいだろう.

*3:大学受験の模試なんかだと,結果が生徒本人に通知され,生徒はその結果を見て志望校を変更する.複数の模試を経ることで,志望校と合格予測は自ずと収束していく.
さて,内定辞退率で同様なフィードバックが,あっただろうか.それができるなら,辞退率だけじゃなくて,内定取得確率も予想できたはずではないのか?