超言理論

特に益もない日記である

NLP若手の会(YANS2024)に行ってきた

ma13.hateblo.jp
ma13.hateblo.jp
ma13.hateblo.jp

「ベテランの若手ではなく,ビギナーの熟練者として振る舞うべきだ」というような言葉をどこかで聞いた気がする.どこかは忘れた.*1

NLP若手の会は今年(2024年)の開催で第19回目,私が初めて参加した2014年の第9回から数えると既に10年が経った.
昨年も書いたが,時代はすでに移り変わり,自分は既に若手の枠からおじさんの枠に変わっていることが如実に感じられる.
自分がベテランの若手から,ビギナーの熟練者たる何者かとしてYANSに参加し,自分が10年前に先達からしてもらったように,若手の誰かの一助となっていればよいと思うばかりである.
そのように言いながら,今年のYANSも会社の営み的な意味合いでの参加で,簡単なトークの機会なども頂き,立場*2が変わってもやはりYANSでは良い経験をさせてもらっているなと感じている今日である.



さて,今年のYANSも限りなく楽しませてもらった一介のおじさんである.
会社の営み的な意味合いで参加して,と言ったうえで,いわゆる"参加報告"というのであれば,発表があったとか賞を授与したとかあれこれ書くことがあるのであろうが,ここはあくまで個人的なただの日記である.
特に何か書くべきということはないのだが,せっかくの機会なので記録は残しておきたい.ということで,せっかくなので対話研究の話をしたい.



私が初めてYANSに参加した2014年は対話の研究についての発表は3件であった.
対して,今年2024年は談話理解・対話カテゴリの発表は19件,開催規模が大きくなっているとはいえ,大いに発表の件数が増えているように見える.
非常に単純に考えると,LLM等の普及によって対話の研究に取り組みやすくなったということではないだろうか.
私の記憶にある対話研究といえば,用例ベースや統計ベースといったごく単純な構造の対話システムか,対話システムでは実験が難しいのでWoZ(つまり対話システムの代わりに人が中に入る)で…というのがよくある話であった.
それがLLMの普及に伴い,とりあえずLLMに「対話をしてくれ」と入れればそれらしい対話ができるようになった.10年間の対話研究の大いなる進歩,といえばその通りであるし,対話研究がやりやすくなることはよいこと以外の何物でもない.
特に,「対話システム自体に興味はないが,対話システムをどう使うか・どう使ったらどのような効果が得られるか」という研究においては,(対話システムの技術的な部分はいったん置いておいて)ある一定の性能を持つ対話システム*3を使って実験をする,というまでのステップが極限まで短くなったように感じる.
一方で,昔からよく問われる「人間と機械の対話って本質的にはどこが違うんですか」とか「機械の対話には人のような目的意識は芽生えるのですか」などという疑問には,まだ明確に答えを出した人はいないのではないかと思う*4



このようなLLMブームに伴う対話研究の興隆に際して,しばしば「それChatGPTでできないの?なんでできないの?できない理由は?」とか「プロンプトの工夫で解けないって証拠はあるの?単なるプロンプトエンジニアリングは研究じゃなくない?」とか「来年にはOpenAIが学習データ作って学習させて,解けるんじゃない?やる意味ある?」とか「学習データがあれば解けるんじゃない?データ作って食わせるだけで研究とは言わないのでは?」などなど,様々なありがたいアドバイスをいただいた.
じゃあ対話研究って何やるんだ?と思うタイミングもあったのだが,いろいろ考えたり,気持ちが変わるような出来事や出会いがあったりして,最近は少しマシである.
もし,似たような気持になっている人や,LLMで対話研究ってどうすれば?と思った人がいればぜひ昨年のYANSのチュートリアルであった理化学研究所GRP/奈良先端科学技術大学院大学 吉野 幸一郎氏の「その研究 ChatGPT でいいんじゃないですか?~LLM時代の対話システム研究~」の資料を読んでいただきたい.
https://pomdp.net/docs/20230831_YANS_print_koichiro.slides.pdf
対話,特に雑談対話と呼ばれる部類のものは明確な「正解」に当たるものがないとよく言われる.これは厄介な性質で,雑談対話に興味のある人からすると,ある人が「正解」だと思う応答が,ほかの人にとっては「正解」だと思われないことがある.逆に,雑談対話に興味のない人から見れば「大体なんでも正解でよい」と言えるし,何を重要であると思っているのか理解してもらえないことも多い.
一方で,雑談対話に,その「理解してもらいづらい何か」を要求・要望している人(少なくともあなた自身)は確かにいることを忘れないでほしい.理解してもらう努力は必要だが,理解してもらえないからと言って価値のない研究だというわけではない.もしそのような人がいるなら,研究の重要性を理解してくれるよき理解者に出会えることを心から願っている.


昨年のYANSのチュートリアルの紹介をしたが,今年のチュートリアルも素晴らしかった.
特に個人的には国立情報学研究所 佐藤 竜馬 氏のチュートリアルニューラルネットワークの損失地形」は興味深かった.
speakerdeck.com
知らなかったので勉強になる,という箇所もあれば,しばしば大学院の輪講などで扱った知識の下で「なるほどね」と改めて腑に落ちるような箇所も多々あり,基礎知識や勉強は裏切らないのだなと痛感する内容であった.
余談ではあるが,自分が大学院の輪講で「次元の呪い」は「サクサクメロンパン」と例示したネタが未だにしばしば登場しているのを見ると面白いような懐かしいような気持になる.もっとわかりやすい例にだれかアップグレードしてくれればいいのだが…
改めて考えるとYANSのチュートリアルや招待ポスターは本当に若手でなくても見ておいて損のない内容が多い.



最近,非常勤講師で大学で講義をすることがあったのだが,その際には過去の資料の踏襲をするのが安全だと思って資料を作った.
一方で,先に書いたLLMブームと対話研究の変化,若手・学生に「本当に理解」してほしいことは何か,それを考えればもっとわかりやすい資料の形もあったのではないかと思う.
ビギナーのおじさんとして何をするべきか改めて考える機会を得られた,良い経験をくれるYANSに一参加者として改めて感謝したい.

*1:正しい表現と出典がわかる方,情報お待ちしています

*2:主に年齢であり,役職などではないことに注意したい

*3:具体例を挙げればChatGPTなど

*4:そのような研究がすでに出ており,私の見落としがあるのならば,ぜひ教えていただきたい


Copyright © 2012-2016 Masahiro MIZUKAMI All Rights Reserved.