1 すらいむ ★ :2024/10/14(月) 19:23:04.74 ID:GvZlJpCr
AppleのAI研究者らが「今のAI言語モデルは算数の文章題への推論能力が小学生未満」と研究結果を発表
OpenAIのGPT-4など大規模言語モデル(LLM)をベースにしたAIは、自然な文章を生成したりさまざまな課題をクリアしたりと、高度で広範な機能を備えています。
しかし、依然として小学生レベルの算数でも、文章題だと人間がしないようなミスをして答えられないケースがあります。
Appleの人工知能科学者が発表した論文では、MetaやOpenAIなどの大規模言語モデルに基づくAIは「基本的な推論能力が欠けている」という研究結果が示されました。
[2410.05229] GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
https://arxiv.org/abs/2410.05229
(以下略、続きはソースでご確認ください)
Gigazine 2024年10月14日 19時00分
https://gigazine.net/news/20241014-llm-reasoning/
OpenAIのGPT-4など大規模言語モデル(LLM)をベースにしたAIは、自然な文章を生成したりさまざまな課題をクリアしたりと、高度で広範な機能を備えています。
しかし、依然として小学生レベルの算数でも、文章題だと人間がしないようなミスをして答えられないケースがあります。
Appleの人工知能科学者が発表した論文では、MetaやOpenAIなどの大規模言語モデルに基づくAIは「基本的な推論能力が欠けている」という研究結果が示されました。
[2410.05229] GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models
https://arxiv.org/abs/2410.05229
(以下略、続きはソースでご確認ください)
Gigazine 2024年10月14日 19時00分
https://gigazine.net/news/20241014-llm-reasoning/
3 名無しのひみつ :2024/10/14(月) 19:36:50.71 ID:9V2urW4D
結局、東大入試の数学は数式だけだから、解けても
つるかめ算が解けないというw
つるかめ算が解けないというw
4 名無しのひみつ :2024/10/14(月) 19:51:07.03 ID:DFXFa0hY
人間の愚かさをナメてもらっては困るぞ
7 名無しのひみつ :2024/10/14(月) 21:18:19.77 ID:SOhktA1I
人間のそれなりに多くの人もこの問題引っかかるだろう
計算に用いない無意味な数字を混ぜるやつ
計算に用いない無意味な数字を混ぜるやつ
8 名無しのひみつ :2024/10/14(月) 21:21:06.39 ID:PDju79k/
問題の書き方に一貫性が無いのが問題だろう
教師の自由裁量すぎる
教師の自由裁量すぎる
10 名無しのひみつ :2024/10/14(月) 22:01:30.52 ID:S1+AJYMX
こういうのに限らず単純に辞書的な使い方をするのでもない限り人間の意図した答えを対話無しで一発で出してくれる方が珍しいでしょ
11 名無しのひみつ :2024/10/14(月) 22:17:07.98 ID:IXwBPV/1
数学屋は答えがちゃんと存在するなら質問のクオリティにはあまりこだわらないからな
14 名無しのひみつ :2024/10/14(月) 22:29:57.81 ID:vYFTnz3i
AIは文系だったか
15 名無しのひみつ :2024/10/14(月) 22:39:38.62 ID:0t+Scbz/
ギレン総帥の演説に洗脳されちゃうもんな
17 名無しのひみつ :2024/10/14(月) 23:10:42.68 ID:DHPTKyHA
推論能力まで獲得したらほんとに人間いらなくなってしまう
知識量で絶対に勝つのは不可能なのに
肉体労働しか生き残れない
知識量で絶対に勝つのは不可能なのに
肉体労働しか生き残れない
20 名無しのひみつ :2024/10/15(火) 01:46:32.92 ID:Ze4GRPRa
言語では、ある程度納得させる言説をするのに数字はからきし駄目?
こういう奴よくいない?w
こういう奴よくいない?w
22 名無しのひみつ :2024/10/15(火) 05:14:52.72 ID:gmlkyDuf
推論が正しいかを客観的に(つまり外部モジュール的に)評価することがないからなあ
まあ、でも、1年しないうちに次のバージョンで出来るようになるんじゃね?
まあ、でも、1年しないうちに次のバージョンで出来るようになるんじゃね?
25 名無しのひみつ :2024/10/15(火) 06:01:25.44 ID:w/NLU3xY
まあ人間とAIとでは得手不得手も違うさ
26 警備員[Lv.7][芽] :2024/10/15(火) 06:10:27.23 ID:7wrZl5Sj
算数の文章題って別に文章としての難易度が高いわけじゃないだろ
ただ正解が一つしかないからとんちんかんな答え返すとそれが間違っているのがばれる
普通の問いでも同じくらいとんちんかんな答え返してると思うぞ
気づきにくいだけで
ただ正解が一つしかないからとんちんかんな答え返すとそれが間違っているのがばれる
普通の問いでも同じくらいとんちんかんな答え返してると思うぞ
気づきにくいだけで
30 名無しのひみつ :2024/10/15(火) 07:06:14.83 ID:BOnKbF9q
LLMはgenAIだ
生成するものだ
推論するものじゃない
生成するものだ
推論するものじゃない
31 名無しのひみつ :2024/10/15(火) 09:11:10.02 ID:0Pv1pnEZ
性能大した事ないよとか論文出されてもな
何が原因でどうやったら改善できるかの展望でも出して欲しいもんだ
何が原因でどうやったら改善できるかの展望でも出して欲しいもんだ
32 名無しのひみつ :2024/10/15(火) 10:19:03.08 ID:7bAK7O2y
Fラン連中よりは有能ってことか
34 名無しのひみつ :2024/10/15(火) 10:29:40.20 ID:fiX/rbFz
大規模自然言語処理でも歯が立たない数学(算数)の問題さん側にも落ち度がある
が法律や約款はもっと面倒だろ
が法律や約款はもっと面倒だろ
35 名無しのひみつ :2024/10/15(火) 10:47:59.32 ID:hFx23M2j
こういうのにこだわってたらいつまで経っても製品化できないわな
38 名無しのひみつ :2024/10/15(火) 12:04:50.32 ID:T/X1dWMI
せめて他と同じ土俵に立ってから、こういう事は言ってくれ
これじゃただの負け惜しみじゃねーか
これじゃただの負け惜しみじゃねーか
39 名無しのひみつ :2024/10/15(火) 12:19:37.38 ID:86FlFhB5
なるほどw
42 名無しのひみつ :2024/10/15(火) 12:45:13.95 ID:2bXkaHRP
単純計算できないもんな
「理解する」ていう仕組みがまだ出来ていないんだろうな
統計のこねくり回しだけではやっぱ限界があるんじゃないか?
「理解する」ていう仕組みがまだ出来ていないんだろうな
統計のこねくり回しだけではやっぱ限界があるんじゃないか?
43 名無しのひみつ :2024/10/15(火) 12:56:17.81 ID:Ze4GRPRa
世界中の算数義務教育レベルテキストをすべてぶち込むところから始めてみては。
44 名無しのひみつ :2024/10/15(火) 13:04:55.68 ID:ATCjRR8y
大抵の大人は小学生未満の頭脳だろ?
47 名無しのひみつ :2024/10/15(火) 16:37:28.71 ID:UTnEwvFN
三段論法を駆使できないうちは小学生レベルから脱することはないだろう
50 名無しのひみつ :2024/10/15(火) 19:15:29.47 ID:sAWho+MY
>>47
その三段論法からして大問題があるんだよ。
大前提:人間はみな死ぬ
小前提:ソクラテスは人間である
結論:ゆえにソクラテスは死ぬ
一体全体、ソクラテスは不死だ、と信じて疑わない奴が「人間はみな死ぬ」という命題を正しいと認めるか??
その三段論法からして大問題があるんだよ。
大前提:人間はみな死ぬ
小前提:ソクラテスは人間である
結論:ゆえにソクラテスは死ぬ
一体全体、ソクラテスは不死だ、と信じて疑わない奴が「人間はみな死ぬ」という命題を正しいと認めるか??
48 名無しのひみつ :2024/10/15(火) 16:49:08.93 ID:0NAGFzbQ
2位の人を追い抜くとあなたは何位?
の答えが凄かった
の答えが凄かった
49 名無しのひみつ :2024/10/15(火) 17:18:18.38 ID:s0ih8nFZ
理系のやつ良かったな
暫く仕事とられなくて済むぞ
暫く仕事とられなくて済むぞ
コメント
コメントする