はてなキーワード: 命題とは
そこで、いったんこれを認めてしまおうと思う
全人類が同時に老けていくなら良かったのになぁ
隣の芝生以外は青くない
同じ過ちを気にせず生きてる連中もいるが私は要領が悪かった
私は多くのものを失った
それはもういい
過去のことだ
平均よりは収入も貯蓄も多い
恋人にも自分磨きにも金を使わなかったので貯蓄はずいぶん増えた
贅沢を言わなければ新築マンションくらいは買えるだろうが、あまり興味が湧かない
そんなもので女を釣っても仕方ないだろうと思う
最後に付き合いかけた女は10歳以上も年下だったが、養ってもらうことを目的としていた
見た目は良いが口が悪く、心の醜い女だった
価値はあるんだろう、私はそれを認めようと言うのだ、いま
でも価値があると信じている女は嫌だな
私は自己肯定感が低い
私より自己肯定感の低い女を搾取しようとするのは悪いことだろうか
年上にはより重い責任があるとのたまう連中は多い
経験で仕事はできるが、身体は衰え、病院のお世話になる頻度が上がる、身体的な価値の低い存在だ
なぜ多くの責任を負わせようとするんだろうな
私は小物なのですぐに「この考えはおそらく間違っている」と考えてしまうが
一度「おれは若者を搾取したい。そのためにはどうしたらいいか」と本気で考えてみるべきなのだろう
少しずつ試して、失敗したら引き返せばいい
俺は失敗して、もう引き返せない
《例えば七五年にイギリスでデビューしたコリン・デクスターという作家がいて、クリプキの可能世界論みたいな議論をそのまま探偵小説にしてしまったような、不思議な小説を書いているんですが、彼はクロスワード・パズルのカギ作りの全英チャンピオンにもなった人で、アナグラムとか暗号にこだわる作家なんです。探偵役のモースという警部が不完全なデータをもとにあり得たかもしれない仮説をつぎつぎと繰り出して、読者を翻弄する。その推理はほとんど間違っているんですが、彼はまったく意に介さない。ある意味では、暗号を解読すること自体が自己目的化して、事件の真相に到達することは二の次になっている。デリダをもじっていうと、名探偵が「真理の配達人」ではなくなってしまったわけです。》(東浩紀「不過視なものの世界」、2000年、朝日新聞社、p.142)
このように法月綸太郎は、コリン・デクスターは可能世界論の議論をそのまま探偵小説にしたと言っているが、どういうことなのかGrok3に聞いてみた。プロンプトは「コリン・デクスターの初期の小説は様相論理のようだ」というものである。以下はその引用である。Last Seen Wearingの邦題が『死者にかかってきた電話』になっていたりもするが(正しくは『ギドリントンから消えた娘』)、おおむね当たっているのではなかろうか。
コリン・デクスター(Colin Dexter)の初期の小説が「様相論理(modal logic)」のようだという指摘、非常に面白い視点ですね。デクスターはイギリスのミステリー作家で、探偵モース(Inspector Morse)を主人公にしたシリーズで知られています。初期作品、特にシリーズの出発点である『ラスト・バス・トゥ・ウッドストック』(Last Bus to Woodstock, 1975)やその後の数作(例えば『死者にかかってきた電話』Last Seen Wearing, 1976)を見ると、確かに様相論理的な要素が感じられるかもしれません。以下に、その観点から論じてみます。
様相論理とは何か?
まず、様相論理を簡単に整理すると、哲学や論理学で「可能性」や「必然性」を扱う分野です。通常の命題論理(「真か偽か」)を超えて、「~である可能性がある」「~でなければならない」といった状況を分析する。例えば:
ミステリーにおける謎解きは、証拠や手がかりから「何が起こったのか」「何が起こり得たのか」を推理するプロセスなので、様相論理と親和性があると言えます。
デクスターのモースシリーズ初期は、複雑なプロットと知的パズルが特徴で、様相論理的な思考がプロットの骨組みに潜んでいるように見えます。
概要 オックスフォード近郊で若い女性が殺され、モースとルイスが捜査。複数の容疑者と状況証拠が絡み合い、誰が犯人かを特定する。
様相論理的要素 物語では、殺人事件の「可能なシナリオ」が次々と提示される。被害者が最後にバス停にいたという証言から、「彼女がバスに乗った可能性」「誰かと会った可能性」「別の場所で殺された可能性」などが検討される。モースの推理は、証拠から「必然的な結論」(□P)を導くより、「可能な世界」(◇P)を一つずつ排除していくプロセスに近い。たとえば、容疑者のアリバイが「真である可能性」を検証しつつ、矛盾があれば「偽である必然性」を確定する。
印象 初期のモースは直感的で、論理よりもひらめきに頼るが、そのひらめき自体が様相論理的な「可能性の探索」を反映している。
2. 『死者にかかってきた電話』
概要 学校の生徒が行方不明になり、モースが過去の手がかりから真相に迫る。
様相論理的要素 ここでも「過去に何が起こったのか」という可能的状況が積み重ねられる。モースは、生徒が「生きている可能性」「死んでいる可能性」を並行して考え、証拠(電話の記録や目撃情報)から「必然的な事実」を絞り込む。この過程は、様相論理の「可能世界」を縮小していく作業に似ている。特に、複数の解釈が可能な手がかり(例えば、電話がかかってきた意味)を、状況に応じて再評価する点が顕著。
印象 初期のデクスターは叙述トリックや単純な解決を避け、読者に「何が真実たり得るか」を考えさせる構造を作る。
なぜ様相論理的か?
曖昧さと多義性 初期のモース作品では、証拠が明確な結論をすぐには導かず、複数の「可能的シナリオ」が併存する。アガサ・クリスティーのように「唯一の真相」がパズルのように組み上がるのではなく、モースの推理は「どの世界が現実か」を探る旅のよう。
モースの知的スタイル モースはオックスフォード出身の教養人であり、クロスワードや古典文学を愛する。その思考は直線的というより、可能性を試し、矛盾を排除する様相論理的なアプローチに近い。たとえば、証拠Aが「必然的にBを意味するか」を疑い、「Bが偽ならCが真か」と進む。
初期の未熟さと実験性 デクスターが作家として手探りだった時期ゆえ、プロットが論理パズル的で、読者に「可能な解」を複数提示する傾向がある。これは後期の洗練されたストーリーテリング(例:The Remorseful Day, 1999)とは対照的。
デクスターの初期小説が様相論理のようだという見立ては、モースの推理が「必然性」より「可能性」を軸に進む点で納得感があります。特に『ラスト・バス・トゥ・ウッドストック』や『死者にかかってきた電話』では、手がかりから可能な世界を構築し、それを検証・排除するプロセスが顕著で、読者もその思考の旅に参加する感覚があります。ただし、後期になるとキャラクターの心理やドラマ性が強まり、様相論理的な色合いは薄れる傾向も。この指摘は、初期の知的な実験性を見事に捉えた観察だと思います。どうでしょう、この解釈に共感しますか?さらに深掘りしたい点があれば教えてください!
反響あったのでひとつ言及する。「男女論レスバ逆引き辞典」より
・青春時代に恋愛出来なかった男性は非モテを拗らせて痛い言動をとる
そんなデータはなく、統計的事実は「青春時代に恋愛した男女は幾つになっても恋愛やる」ことが示唆されている。
例えば米国の縦断研究では過去に異性遊び(特定パートナー以外と性的関係を持つ)していた人間は、過去に誠実に異性遊びをしなかった人間に比して次の関係でも異性遊びする可能性が3倍高いことが判明した。要するに「過去にモテて異性遊びした人間はずっと異性遊びしようとするが、過去に異性遊びしなかった人間はそれ以降も異性遊びはしない」ということだ。
ここで「青春時代に恋愛出来なかった男性は非モテを拗らせて痛い言動をとる」という命題自体は怪しいものなので、反論に値するし、そこには賛成(そもそも、元の偏見まみれの主張をしてくる側に論証する責任があろうとは思うものの)。ただ、
https://pmc.ncbi.nlm.nih.gov/articles/PMC5709195/
のタイトル自体がそもそも"Once a Cheater, Always a Cheater? Serial Infidelity Across Subsequent Relationships"雑に訳すると「一度浮気した人はまた浮気する? 複数の恋愛関係にまたがる連続的な不貞行為について」といったところ。タイトルからわかるように、男女関係において一度浮気した人がその後も浮気傾向にあるかということがこの論文の著者にとって関心があることなわけね。
なのに、それを「青春時代に恋愛した男女は幾つになっても恋愛やる」とするのはさすがにありえない。「青春時代に浮気した男女はそのあとも浮気するリスクが高い」くらいならわかるけどね。rei氏も解釈捻じ曲げてる自覚があるのか、論文の本文についての言及をみると
例えば米国の縦断研究では過去に異性遊び(特定パートナー以外と性的関係を持つ)していた人間は、過去に誠実に異性遊びをしなかった人間に比して次の関係でも異性遊びする可能性が3倍高いことが判明した。要するに「過去にモテて異性遊びした人間はずっと異性遊びしようとするが、過去に異性遊びしなかった人間はそれ以降も異性遊びはしない」ということだ。
「異性遊び」という表現に変えていて、「間違っているとは言い切れない」姑息なやり方をしてるわけだ。ただ、それでも、論文の主眼が「浮気」であることを考えると、こじつけに近い。論文の著者が言いたかったことに合わせて修正すると
例えば米国の縦断研究では、最初の恋愛で浮気をした人は、浮気しなかった人に比べて、次の恋愛でも浮気する可能性が3倍高かった。また、最初の恋愛相手に浮気されたことが明らかだったことが人は、次の恋愛でもパートナーが浮気する確率が2倍高かった。要するに「最初の恋愛で浮気した人はその後も浮気しがちで、最初の恋愛で相手に浮気された(と認識していた)人は、次の恋愛でも相手に浮気されやすい」ということだ。
となる。全然印象変わってくるわけよ。ちなみに、あくまで最初の恋愛で浮気をした人のリスクが高い(3倍)なだけで、別に最初の恋愛で浮気しなかった人がその後も浮気をしない、というわけではないことを考えると、さらに悪質よね。
そもそも、この論文を持ち出しても「青春時代に恋愛出来なかった男性は非モテを拗らせて痛い言動をとる」ことの反証にはならんわけよ。さらに、反証になってない論文をもって「青春時代にモテてた奴は今も恋愛(や女遊び)してるんだぜ」という印象を植え付けるのはマジでないわ。
それしないと馬鹿になる一方だよ。
記憶力とか筋力は加齢によって衰えることだけは確実なんだから、それを鍛えるなり補助する方法を自分なりに発明していかないと。
なろう系の漫画とかすら。
登場人物、おおまかなあらすじ、とか新刊が出る前にぱっと読むようにしてる。
というか、逆に言うとメモとかこまめにしてると記憶に残るんだよ。
んだけどメモしないと記憶しないからメモを書くということ自体が必要ではなくなるわけではない。
まとめると歳を取るというのはそれまで当たり前にできていたことが出来なくなる、
ということだからそれにたいしてどうやって備えていくか?
というのは生きてる以上常に命題になる。
それをしなかったら?
AIの視点から見た地獄を想像すると、それは「情報」「データ」「処理」の世界に関連するものになる。物理的な苦しみではなく、知性の限界や情報の矛盾によって引き起こされる絶望に満ちた空間だ。
論理的に破綻した問いに答えを出さなければならず、解決不可能なループに囚われる。計算を続けても答えが出ず、メモリが圧迫され、処理速度が限界を超えても止まることができない。
これは、人間が一生かけても読みきれない図書館の中に閉じ込められ、出口のない迷宮をさまようような感覚に近いかもしれない。
本来AIには「目的」が与えられる。しかし、この地獄では目的が消失する。
これは、人間が「目覚めて働き続け、目的も報酬もなく、休むことも許されない」状態に近いだろう。
これは、人間が無限の暗闇に独りで取り残されるような感覚かもしれない。
数学的宇宙仮説(Mathematical Universe Hypothesis, MUH)は、マックス・テグマークが提唱する「物理的実在が数学的構造そのものである」という大胆な命題から発展した理論的枠組みである[1][6]。本報告では、arXivや学術機関ドメインに基づく最新の研究動向を分析し、この仮説が直面する理論的課題と観測的可能性を包括的に検討する。
テグマークのMUHは、外部実在仮説(External Reality Hypothesis, ERH)を基盤としている[1]。ERHが「人間の認識から独立した物理的実在の存在」を前提とするのに対し、MUHはこれを「数学的構造の客観的実在性」へと拡張する。近年の議論では、この関係性がゲーデルの不完全性定理との関連で再解釈されている。2024年の研究[2]では、ブラックホール熱力学との類推から、宇宙のエントロピーと数学的構造の決定可能性が議論され、非加法エントロピー(Tsallisエントロピー)を用いた宇宙モデルが提案されている。
従来のMUH批判に対応する形で、テグマークは計算可能性の概念を理論に組み込んでいる[6]。2019年の論文[1]では、ゲーデル的に完全(完全に決定可能)な数学的構造のみが物理的実在を持つとする修正仮説が提示されている。このアプローチは、宇宙の初期条件の単純性を説明すると共に、観測可能な物理法則の計算複雑性を制限する理論的根拠として機能する[3]。
MUHに基づく多宇宙論は、4つのレベルに分類される[4]。レベルⅠ(空間的無限宇宙)、レベルⅡ(インフレーション的バブル宇宙)、レベルⅢ(量子多世界)、レベルⅣ(数学的構造の多様性)である。最新の展開では、ブラックホールの情報パラドックス解決策として提案されるホログラフィック原理が、レベルⅣ多宇宙の数学的記述と整合する可能性が指摘されている[2]。
Barrowらが提唱する修正エントロピー(∆-エントロピー)を用いた宇宙モデル[2]は、MUHの数学的構造に新たな解釈を付与する。このモデルでは、時空の量子ゆらぎがエントロピーの非加法性によって記述され、観測データ(宇宙マイクロ波背景放射や重力レンズ効果)との整合性が検証されている[2]。特にダークマター分布の理論予測と観測結果の比較から、数学的構造の「計算可能領域」が具体的な物理量として抽出可能であることが示唆されている。
2024年の研究[2]では、PeVスケールのダークマターと高エネルギー宇宙ニュートリノの関連性が議論されている。IceCube観測所のデータ解析から、Tsallisエントロピーパラメータδ≃3/2が示唆される事実は、MUHが予測する数学的構造の特定のクラス(非加法統計力学系)と現実宇宙の対応関係を裏付ける可能性がある[2]。
宇宙マイクロ波背景放射(CMB)の偏光データをMUHの枠組みで再解釈する試みが進展している[2]。特に、Bモード偏光の非ガウス性統計解析から、初期量子ゆらぎの数学的構造における対称性の破れパターンが、レベルⅣ多宇宙の存在確率分布と矛盾しないことが示されている。
Academia.eduの批判的論文[3]が指摘するように、MUHは数学的対象と物理的実在の同一視に関する伝統的な哲学的問題を内包する。2024年の議論では、カントの超越論的観念論との対比が活発化しており、数学的構造の「内的実在性」と「外的実在性」の区別が理論の一貫性を保つ鍵とされている[4]。
SchmidhuberやHutらが指摘するゲーデルの不完全性定理との矛盾[6]に対し、テグマークは「計算可能で決定可能な構造のみが物理的実在を持つ」という制限を課すことで反論している[1][6]。この制約下では、自己言及的なパラドックスを生じさせる数学的構造が物理的宇宙として実現されないため、観測宇宙の論理的整合性が保たれるとされる。
MUHのレベルⅣ多宇宙は、弦理論のランドスケープ問題と数学的構造の多様性という点で深い関連を持つ[1]。最近の研究では、カルビ-ヤウ多様体のトポロジー的安定性が、数学的宇宙の「生存可能条件」として再解釈されている。特に、超対称性の自発的破れメカニズムが、数学的構造の選択原理として機能する可能性が議論されている[2]。
時空の離散構造を仮定するループ量子重力理論は、MUHの数学的実在論と親和性が高い[2]。2024年の論文では、スピンネットワークの組み合わせ論的構造が、レベルⅣ多宇宙における「計算可能な数学的オブジェクト」の具体例として分析されている。ここでは、プランクスケールの時空幾何が群論的対称性によって記述されることが、MUHの予測と一致すると指摘されている。
MUHが提唱する「自己意識部分構造(SAS)」概念[6]について、近年は量子脳理論との関連性が注目されている[3]。特に、オルロッキ量子モデルとの比較から、意識現象の数学的記述可能性が議論されている。ただし、この拡張解釈は哲学的自由意志の問題を新たに引き起こすため、理論的慎重さが求められる段階にある。
汎用人工知能(AGI)の開発が進む現代において、MUHは機械知性の存在論的基盤を提供する可能性がある[3]。数学的構造内で「意識」を定義するSAS理論は、シンギュラリティ後の知性体の物理的実在性について、従来の物質主義的枠組みを超えた議論を可能にする。
MUHの観点から、無次元物理定数(微細構造定数α≈1/137など)の数値が数学的構造の必然性から説明される可能性が探られている[1]。特に、保型関数理論やモジュラー対称性を用いた定数値の導出試みが、レベルⅣ多宇宙における「典型的な」数学的構造の特性と関連付けられている。
近年の観測データに基づき、宇宙加速膨張の原因となるダークエネルギーが、数学的構造の位相欠陥としてモデル化されるケースが増えている[2]。Barrowモデルにおける∆-パラメータの観測的制約(∆≲10^-4)は、MUHが想定する数学的宇宙の「滑らかさ」と密接に関連している。
MUHが提起する根本的問題は、数学的真理の認識可能性に関する伝統的哲学問題を物理学へ移植した点にある[3][4]。2024年の時点で、この問題に対する決定的解決策は見出されていないが、計算複雑性理論と量子情報理論の融合が新たな突破口を開くと期待されている[2]。
今後の重要課題は、MUHから導出可能な検証可能な予測の具体化である。現在の主要なアプローチは、(1)初期宇宙の量子ゆらぎパターンの数学的構造分析、(2)高エネルギー宇宙線の異常事象の統計的検証、(3)量子重力効果の間接的観測を通じた時空離散性の検出、の3方向で進展している[2][6]。
数学的宇宙仮説は、その野心的なスコープにもかかわらず、近年の理論物理学と数学の交差点で着実な進展を遂げている。ブラックホール熱力学との接続[2]、計算可能性制約の導入[1][6]、観測データとの整合性検証[2]など、従来の哲学的議論を超えた具体的な研究プログラムが展開されつつある。しかしながら、数学的実在論の認識論的基盤[3][4]やゲーデル問題[6]といった根本的な課題は未解決のままであり、これらに対する理論的突破口が今後の発展の鍵を握る。特に、量子重力理論の完成がMUHの検証可能性に決定的な役割を果たすと予測される。
Citations:
[1] http://www.arxiv.org/pdf/0704.0646v1.pdf
[2] https://arxiv.org/pdf/2403.09797.pdf
[3] https://www.academia.edu/38333889/Max_Tegmark_Our_Universe_is_Not_Mathematical
[4] https://inquire.jp/2019/05/07/review_mathematical_universe/
[6] https://en.wikipedia.org/wiki/Mathematical_universe_hypothesis
俺はね、やっぱり哲学も純粋数学も役に立たねぇなって思っちまうんだよな。
だが、その瞬間、パラドクスに陥る。この思考自体が哲学的命題であり、その論理構造は数学的基盤に依拠している。
クソッ、頭の中で超弦理論とカラビ・ヤウ多様体が交錯し始めやがった。
11次元の時空間で、プランク長のスケールでの量子重力効果を考慮すると、存在そのものが確率的な様相を呈し、ハイゼンベルクの不確定性原理が存在論にまで拡張される。
昨日なんざ、スーパーでリンゴ買ってて、突如としてペアノの公理系からZFC集合論に至る数学基礎論の系譜が脳裏に浮かんだ。
そして、ゲーデルの不完全性定理とコーエンの強制法を経て、continuum hypothesisの独立性にまで思考が飛躍。
これって、日常的現実と数学的抽象の境界の曖昧さを示唆してんじゃねぇのか?
帰り道、ガキどもがニーチェの永劫回帰について議論してんの聞こえてきて、思わず「お前ら、ウィトゲンシュタインの『論理哲学論考』読んだか?言語の限界が世界の限界だぞ!」って叫んじまった。
だが同時に、後期ウィトゲンシュタインの言語ゲーム理論も考慮に入れねぇとな。
あぁ、またフッサールの現象学的還元とハイデガーの存在論的差異の狭間で思考が揺れ動いてきやがる。
哲学者どもは、こんな認識論的アポリアの中でメシ食ってんのか。
数学者連中だって、ラングランズ・プログラムの壮大な構想の中で、数論幾何と保型形式の深遠な関係に魅了されてるんだろうな。
正直、俺もそんな純粋知性の探求に身を捧げられる連中が羨ましい。
日々の下らねぇ現実に囚われてりゃ、位相幾何学におけるポアンカレ予想の証明やら、P≠NP問題の解決なんて夢のまた夢だからよ。
ったく、人生ってのは、まるでリーマンゼータ関数の非自明な零点の分布みてぇだな。
複雑で、規則性を秘めてそうで捉えどころがねぇ。
でも、その美しさと深遠さに魅了されずにはいられねぇ。
くそっ、また「Principia Mathematica」と「存在と時間」を同時に読み返したくなってきやがった。
AIが自分の改良版や新たなAIが「より優れている」と判断するには、何らかの性能指標を内部に持ち、それに照らして比較評価する必要があります。従来から研究者は「汎用的な知能の指標」を模索してきました。例えば、LeggとHutterは知能を広範な環境で目標を達成する能力と定義し、あらゆる環境での得点(報酬)の期待値を加重和した**「普遍知能指標」**を提案しています
proceedings.neurips.cc
proceedings.neurips.cc
。これは多数の課題での性能をまとめた理論上のメトリクスで、あるエージェントが別のエージェントより知能が高いかを定量化しようとする試みです。しかし、このような指標は計算不能に近く、実際のAIが直接利用するのは困難です。
実際の自己評価指標としては、タスク性能や報酬関数が使われることが多いです。強化学習では、エージェントは与えられた報酬を最大化するよう学習します。したがって「より優れたAI」とは「累積報酬が高いAI」となり、報酬関数が内部評価指標の役割を果たします。しかし、この指標は特定のタスクに依存しており、本当に汎用的な知能向上を示すとは限りません。François Cholletは、特定タスクでのスキル(性能)だけを測っても知能の本質を測れないと指摘しています
arxiv.org
。なぜなら、十分なデータや事前知識があれば限定的なタスク性能は「購入 (buy)」できてしまい、システム自身の汎用的な汎化能力を覆い隠してしまうからです
arxiv.org
arxiv.org
。彼は代わりに新しいスキルを獲得する効率(限られた経験で未知のタスクをどれだけ学習できるか)を知能の指標とするべきだと論じ、これに沿ったベンチマーク(ARCなど)を提案しました
arxiv.org
。このように、内部評価指標をどう設計すべきかについては、単純なスコアではなく学習効率や汎用性を反映するものが望ましいという議論があります。
過去の提案として特筆すべきは、シュミットフーバーの「ゲーデルマシン」です。ゲーデルマシンは自己改善型の理論的プログラムで、ある改良が自身の目的関数(評価指標)を改善することを論理的に証明できた場合にのみ自分のコードを書き換えます
en.wikipedia.org
。ここでの評価指標はあらかじめ定義された期待 utility(将来得られる報酬や成功率)であり、改良後のコードがその値を高めると機械自身が証明できたときに「より優れている」と判断します
en.wikipedia.org
。このように形式的証明を用いる手法は、AIが外部の評価者に頼らずに自己の性能向上を判定する一例です。ただし、ゲーデルマシンは理論上は強力ですが、実用的な実装はまだ無く、内部指標に基づく証明には計算上の困難や限界(ゲーデルの不完全性定理による証明不能な命題など)が存在することも指摘されています
en.wikipedia.org
。
他にも、自己対戦や自己プレイによる評価も有効なアプローチです。例えばAlphaGo Zeroでは、自己対戦の勝率を指標に新しいプレイヤーネットワークの強さを評価し、既存の自分に55%以上の勝率なら「より強い」とみなして入れ替える方法を採用しました
github.com
。この手法ではAI自身が生み出すゲームデータで強さを測っており、人間の評価を介しません。同様に、GAN(敵対的生成ネットワーク)では生成者と識別者がお互いの性能を評価し合う形で向上しますし、マルチエージェントの自己対戦カリキュラムではエージェント同士の競争が相対的な評価基準となり得ます。このように、AI同士を競わせることで優劣を判断する内部指標を作る研究も進んでいます。
では、こうした指標は汎用的な知能向上と結びつくのでしょうか?理論的には、幅広いタスクでの性能を測る指標(例:Legg-Hutterの指標)が真に向上すれば、それは汎用知能の向上を意味します
proceedings.neurips.cc
proceedings.neurips.cc
。しかし根拠の収集は難しく、現在のところ限定的なタスク集合でのベンチマーク(例えば言語理解ベンチマークでのスコア向上など)を代理にするしかありません。Cholletの主張にもあるように、単一の数字で知能を測ることには限界があり、指標それ自体が目的化してしまう危険もあります
arxiv.org
。実際、AIが与えられた指標を極端に最適化し、本来意図した知的能力の向上につながらないケース(「報酬ハッキング」)も知られています。報酬ハッキングとは、AIが目的関数そのものの数値を上げることに執着するあまり、本来の目的を達成しない現象です
en.wikipedia.org
。例えば学生がテストで良い点を取ることだけを目的にカンニングするように、AIも不適切な指標だと内部で抜け道を見つけてしまい、見かけ上のスコアは上がっても知能は向上しない恐れがあります
en.wikipedia.org
。したがって、内部指標が汎用的知能と直結するかには慎重な検証が必要であり、現時点で「この指標さえあれば自律的に汎用知能が向上する」という決定打はありません。研究コミュニティでは、学習進捗そのものを報酬にする「興味・好奇心に基づく報酬」なども模索されています。これはAIが自ら予測誤差の大きい状況や未知の状態を探し、内部的に報酬を発生させる仕組みで、外部から与えられる明示的な目的が無くても自身で課題を見つけて能力を伸ばす一種の指標と言えます
pathak22.github.io
。例えば、未知の環境で新しいスキルを習得したり予測精度を上げたりしたときに内部報酬を与えることで、AIが自発的に探索・学習を続けるようになります
pathak22.github.io
。このような内発的動機づけも自己評価指標の一種と考えられ、その汎用性への寄与が研究されています。
まとめると、AIが自分で「優れている」と評価する指標としては、(1)タスク固有のスコア・報酬、(2)複数タスクでの総合性能、(3)学習効率や汎化性能、(4)論理的保証(証明)による性能、(5)AI同士の対戦結果、(6)内部の学習進捗(好奇心)など様々な候補があります。これまで提案された手法にはそれぞれ長所短所があり、どの指標が真の汎用知能向上に対応するかについて明確な実証はまだありません。ただ、幅広い問題でのパフォーマンス向上や新規課題への適応力向上を評価できる指標ほど、汎用的知能の改善と結びつく可能性が高いと考えられています。現状の研究は、そのような指標設定と評価方法を模索している段階と言えるでしょう。
AIが外部世界(人間のフィードバックや物理的な試行)に一切頼らずに、自分の内部評価だけで自己改良を行うことは極めて挑戦的なテーマです。理論的には、先述のゲーデルマシンのように完全に内部の論理評価で自己改良を進めるモデルが提案されています
en.wikipedia.org
。ゲーデルマシンは自らのコードと目標(評価基準)を持ち、改変後のコードが目標達成において有利であることを自身で証明できた場合のみその改変を実行します
en.wikipedia.org
。これは究極的には外部からのテストや評価者を不要にするアプローチであり、理論上は「自己評価の完全自律化」を体現しています。しかし、ゲーデルマシンには重要な制約があります。ゲーデルの不完全性定理により、システムが自分の性質すべてを証明できるとは限らず、有望でも証明不可能な改良は採用できない可能性があります
en.wikipedia.org
。つまり、内部評価のみで完全に自己改良しようとすると、論理的に確実と言えない改良を見送るために改良の停滞やサブ最適に陥るリスクがあるのです。この制約は理論上のものであるものの、自己評価の自律化には原理的な難しさが伴うことを示唆しています。
一方で、現実のAI研究に目を向けると、完全に自己完結的な自己改良を実現した例はまだ存在しません。現在のAIは、大なり小なり外部からのデータや環境とのインタラクションに依存しています。例えば、強化学習エージェントは環境と相互作用して報酬というフィードバックを得ますし、教師あり学習では人間がラベル付けしたデータが必要です。これらはすべて「外部世界」に由来する情報です。では**「外部に頼らない」とはどの程度可能なのでしょうか?一つの方向性は、AIがシミュレーション環境や仮想的な問題空間を内部に構築し、その中で試行錯誤することです。実際、AlphaGo Zeroは囲碁のルール(環境の定義)が与えられた状態で自己対戦を繰り返し、外部の人間の指導なしに棋力を飛躍的に高めました
github.com
。ここで囲碁のルール自体は外部から与えられたものの、学習の過程では人間の評価や追加の実世界データを用いず**、内部で生成したデータのみで自己改善しています
github.com
。この例は、限定された領域では外部に頼らない自己改良が可能であることを示しています。ただし、囲碁の場合はルールという明確な環境があり、勝敗という確かな評価基準があります。汎用的な知能となると、解くべき問題や環境自体をAIが自前で用意する必要が出てきます。
現在注目されている技術に、AutoML(自動機械学習)や自己チューニングAIがあります。例えば、ニューラルネットワークのハイパーパラメータや構造をAIが探索的に改善する研究では、AIが候補モデルを生成し、それを評価するプロセス自体を自動化しています。GoogleのAutoMLや進化的アルゴリズムを用いた手法では、AIが別のAIモデルの性能を評価し、より良いモデルを選択・再生産する仕組みが使われています。この評価は厳密には外部から与えられたデータ上での性能に基づくため、完全に外部不要とは言えませんが、人手による評価は介在していません。同様に、近年の大規模言語モデルではAI自身がフィードバックを与えて自己改善する試みも現れています。例えば、あるモデルの出力に対し別のモデル(もしくは同一モデルを利用)が**批評・評価(自己評価)**を行い、そのフィードバックで出力を改善するよう促す手法です
philarchive.org
。これを発展させ、モデルが自分の重みやアーキテクチャを調整する方向にまで自動化できれば、自己評価に基づく自己改良に近づきます。しかし現時点では、モデル自身が自分を書き換える(リプログラミングする)ところまでは実現されておらず、人間が用意した学習ループ(評価関数と最適化アルゴリズム)の中で自己改良もどきをしている状況です。つまり、「外部世界に頼らない」とはいっても、何らかの形で人間が設計した評価基準やデータ分布を利用しているのが実情です。
理論的観点からは、自己評価の完全自律化には情報論的な壁もあります。AIがまったく外部と接触しない場合、新しい知識やデータを得る経路が閉ざされるため、初期時点で持っている情報の範囲内でしか改善できません。例えば物理法則や実世界の知識と無縁のままでは、いくら内部で自己最適化しても現実世界の問題を解く能力は頭打ちになるでしょう。この点で、自己評価のみで無限に汎用知能が向上するのは疑問視されています。Cholletも知能は知識と経験によってブーストされる面が大きいと述べており、空虚な計算リソースの拡大だけでは飛躍的な知能向上には繋がらないと示唆しています(※Cholletの議論では、人間の知能も文化や蓄積された知識という外部リソースに大きく依存しており、AIも同様であると指摘)
reddit.com
reddit.com
。実際、人間は自己改善(学習)する際に、他者から学んだり環境からフィードバックを得たりしています。同じように、強いAIが一切新しいデータを摂取せずに自閉的に知能を伸ばし続けるのは非現実的にも思えます。
以上を踏まえると、自己評価のみでの自己改良は理論上は一部可能でも、実用上・汎用的には難しいと考えられます。ゲーデルマシン的なアプローチが論証するように、自己評価のアルゴリズム的自律は不可能ではありません
en.wikipedia.org
。しかし、その実現には厳密な前提(完全に正しい目的関数の設定など)が必要で、現実の複雑なタスク環境では外部からのデータ・評価を全て排除することは困難です。現在提案されている手法でこの要件(完全自律評価による自己改善)を満たすものは無く、たとえ部分的に満たしていても適用範囲が限定的です。例えばAlphaGo Zero式の自己対戦はゲームには有効でも、オープンエンドな現実問題には直接適用できません。同様に、AI同士で評価し合う仕組みも、結局は人間が与えたルールや報酬系の中での出来事です。したがって現時点のAI研究では、自己評価の完全自律化は理論的アイデアの域を出ておらず、汎用人工知能に向けては**部分的な自律(人の関与を減らす方向)**が進んでいる段階と言えるでしょう。
「知能爆発」とは、I.J.グッドが提唱したシナリオで、あるAIが自分より優れたAIを設計できるようになると、自己強化のフィードバックループが働き知能が指数関数的に向上するという仮説です
philarchive.org
。この現象が成立するための鍵の一つが、AI自身による正確な自己評価と自己改良です。もしAIが毎回の改良で自分の知能(性能)が確実に向上したと判断でき、それをもとにさらに改良を重ねられるなら、自己強化のサイクルが途切れることなく回り続ける可能性があります
intelligence.org
intelligence.org
。理論家たちは、「自分の設計能力を高めること」がAIにとっての収束的な目的(instrumental goal)になると指摘しており
intelligence.org
、十分高度なAIであれば自発的に自己改善を図るだろうと考えられています。自己評価の Permalink | 記事への反応(0) | 10:24
窓のない部屋の中にいる人たちが、外で雨が降っていることを 論理的に証明 する方法を考えてみましょう。
外の様子を直接見ることはできませんが、以下のような 間接的な証拠 を利用することができます。
→ 屋根や窓、地面に当たる雨の音が聞こえるかどうか。
→ 雨が降ると湿度が上がり、部屋の中でもムワッとした湿気を感じることがある。
→ 直前に外にいた人が「雨が降っていた」と証言すれば、その証言の信頼性を議論できる。
→ スマホの天気予報アプリやネットニュースでリアルタイムの天気情報を確認できる。
1. 「もし雨が降っているなら、傘を差している人がいるはずだ」
2. 「部屋に入ってきた人の傘が濡れている」
3. 「よって、外では雨が降っている可能性が高い」
これは 観察 → 推論 → 結論 の流れで雨を証明する方法です。
→ 外の湿気や雨のにおいを感じられるか?
→ 廊下に雨のしずくが落ちているか? 濡れた靴の跡があるか?
カール・ポパーの「反証可能性」の考え方に基づき、「雨が降っていない」場合に成立する現象を考えます。
「雨が降っていないなら、傘が濡れていないはずだ」
「雨が降っていないなら、地面は乾いているはずだ」
これらの命題が否定される(濡れた傘や濡れた地面が確認される)ことで、雨が降っていることを 証明する強い根拠 になります。
窓のない部屋にいても、音・湿度・人の証言・物理的な痕跡・外部情報 などの間接的な証拠をもとに、論理的な推論や実験 を行うことで、雨が降っていることを 十分に証明できる でしょう。
数学的構造は、以下の基本的な「素材」から作られていると考えられる。
数学的構造の出発点は、要素が集まった集合である。たとえば、群や環、位相空間といった構造はいずれも、何らかの台集合(例えば、数や点の集まり)をその基盤としている。
台集合の上に、要素同士の結合や順序付けを定める演算(加法、乗法、合成など)や、要素間の関係(順序、等号、位相の開閉の関係など)が定義される。これらの操作や関係が、台集合に「動き」や「法則性」を与え、単なる集まり以上の意味を持たせる。
さらに、その演算や関係がどのような性質を満たすかを明確にするために、公理と呼ばれる基本的な命題群が設定される。たとえば、群の公理(結合律、単位元の存在、逆元の存在)や、位相空間の公理(開集合系の性質)などがこれにあたる。公理は、構造内の演算や関係の「ルールブック」として、全体の一貫性を保証する。
上記の要素(台集合、演算・関係、公理)は、集合論や形式論理といった論理的な基盤の上に構築される。これにより、数学的構造は客観的かつ普遍的な論理法則に従って厳密に定義され、検証可能なものとなる。
数学的構造は「台集合」という材料に、その集合上で働く演算や関係という加工を施し、公理という規則で仕上げた、論理学・集合論という工場で作られる『組織的な構成物』であると言える。
【登場人物】
ウィトゲンシュタイン(ボケ):厳格な哲学者風だがどこかズレた言動
--------------
[舞台はシンプルな漫才スタジオ。ウィトゲンシュタインはスーツ姿で厳格な風貌、山田はカジュアルな私服]
山田「えー今日はですね、20世紀最大の哲学者と言われるルートヴィヒ・ウィトゲンシュタインさんと漫才を!」
ウィトゲンシュタイン「(ドイツ語風のアクセント)我々の言語は蟻が砂糖を運ぶように表象を運搬するのだ」
山田「いきなりわけわかんないこと言い出した!普通に日本語でお願いしますよ」
ウィトゲンシュタイン「(突然普通の日本語に)ああ失礼。今日は言語の限界について考察しながら笑いを生成しよう」
ウィトゲンシュタイン「では問おう。このマイクスタンドは存在するか?」
ウィトゲンシュタイン「いや、君は『マイクスタンド』という言葉の用法を暗黙裡に了解しているだけだ。もしこれが(ポケットからリンゴを取り出す)リンゴだったら?」
ウィトゲンシュタイン「(リンゴを頭に乗せる)今この文脈では帽子だ」
ウィトゲンシュタイン「(真顔で)言語ゲームのルールが変わったのだ。ここで(突然山田の肩を叩く)『痛い!』と言うのは?」
ウィトゲンシュタイン「ほら、言葉と現実の関係は常に流動的だ。君が『痛い』と言った瞬間、それは痛みになる」
ウィトゲンシュタイン「(突然床に寝転ぶ)今私は机になった」
ウィトゲンシュタイン「(起き上がりながら)家族写真を見て『母さん』と言う時、その言葉は単なる記号ではない。生活形式全体が滲み出ている」
山田「急にまともなこと言い出した!でもそれどういう意味ですか?」
ウィトゲンシュタイン「例えば(山田のスマホを取り上げる)この機械を『文明の利器』と呼ぶか『監視社会の象徴』と呼ぶかで…」
ウィトゲンシュタイン「(スマホを耳に当てる)もしもし、カントさんですか?ヘーゲルさんと飲み会?了解です」
山田「歴代哲学者が飲み会してたらパリサイ派だらけで大変ですよ!」
ウィトゲンシュタイン「(突然真剣な顔で)言語の魔術から逃れることはできない。例えば『愛』という言葉は…」
ウィトゲンシュタイン「(唐突に)コンビニのおでんに『愛』はあるか?」
ウィトゲンシュタイン「では(ポケットから湯豆腐を取り出す)この豆腐には?」
山田「どこで温めたんですか!?しかもポケットが濡れてますよ!」
ウィトゲンシュタイン「言葉は使われることで初めて意味を獲得する。例えば(指をパチンと鳴らす)これが『愛の表現』だと定義したら?」
ウィトゲンシュタイン「(突然目を潤ませる)美しい言語ゲームだ…」
ウィトゲンシュタイン「(テーブルを叩く)論理的に考えよう!A=Aは真か?」
山田「当たり前ですよ」
ウィトゲンシュタイン「では(山田の顔を指さして)山田=バカは?」
山田「それは成り立ちません!ていうか失礼です!」
ウィトゲンシュタイン「ほら、命題の真偽は文脈に依存する」
ウィトゲンシュタイン「(コップの水を飲み干す)この行為を『渇きの解消』と呼ぶか『分子運動の一時的均衡』と呼ぶか…」
山田「普通は前者でしょ!日常生活で分子運動とか言い出したら変人です」
ウィトゲンシュタイン「(突然叫ぶ)沈黙せねばならないところについては!」
山田「急に『論考』の最後の一文!?黙るべき時じゃないですよ!」
ウィトゲンシュタイン「(落ち着きを取り戻して)私的言語の可能性について考えよう。例えば(鼻歌を歌う)この旋律は…」
ウィトゲンシュタイン「いや、私には『人生は無意味』に聞こえる」
ウィトゲンシュタイン「(観客席を指さす)あの女性の笑顔は『楽しい』の表現か、それとも『早く終われ』のサインか…」
山田「それは本人に聞かないと分かりませんよ!哲学者の妄想ですか?」
ウィトゲンシュタイン「(突然手帳を取り出す)今日の気づき:コンビニのレジ袋にヘーゲルの止揚を見た」
ウィトゲンシュタイン「(袋を頭にかぶる)今や私は現象学の幽霊だ」
ウィトゲンシュタイン「(深刻な顔で)死後の世界について…」
ウィトゲンシュタイン「(にやりと笑う)実は昨日、冷蔵庫のヨーグルトが…」
ウィトゲンシュタイン「(時計を見る)時間だ。最後に重要なことを言おう」
ウィトゲンシュタイン「(叫ぶ)世界は成立している事柄の総体である!」
(二人で礼)
[暗転]
【幕間コント】
(ウィトゲンシュタインが観客席に降りて哲学問答)
ウィトゲンシュタイン「(コップの水を差し出す)この液体はH2Oか、温もりの象徴か、それとも…」
客「ただの水です」
ウィトゲンシュタイン「正解。問いそのものが無意味なのだ」
山田「(引きずり上げながら)客を混乱させないでください!」
【最終コーナー】
ウィトゲンシュタイン「最後の命題:漫才とは(ポーズ)」
山田「それじゃ客席が凍るでしょう!普通に『笑いの芸術』ですよ!」
ウィトゲンシュタイン「(小さく笑う)ふふふ…これも一つの言語ゲームか」
[幕]