OpenAI o3は,人間とは全く異質の汎用知能である恐れがある. 競技プログラミングCodeforcesで,人類に混じってo3が全世界175位となったのはすさまじい. ガチの数学者たちが全力で作ったベンチマークFrontierMathで,o1-previewでも2%しか正解しなかったところが,o3では25%も正解してしまった. しかし,一番の問題はそこではない. 全く別次元のところにある. ARC-AGIというベンチマークだ. o1で25%だったところを,o3で75.7%と大幅に更新したが,これはただ点数が上がったという話では終わらないのだ. ARC-AGIの公式アナウンスやその他様々な情報源を元に,以前からARC-AGI領域をモニタリングしていた東大在籍の研究者の卵が解説する. ARC-AGIとは大雑把に言うと,人間には簡単だが,従来のAIが無理矢理解くことはほぼ不可能なベンチマークで