2023年11月25日のブックマーク (2件)

  • Q* の勝手な予想メモ|深津 貴之 (fladdict)

    OpenAIのQ*というモデルアプローチに関してメモ。この分野は素人なので、あくまで勝手な予想です。 Qラーニングとは?Q学習(Q-learning)は、強化学習の一種で、エージェントが最適な行動を学習する方法です。このアプローチでは、エージェントは環境との相互作用を通じて、各状態でどの行動を選択することが最も報酬をもたらすかを学習します。 A*は?A*(エースター)アルゴリズムは、最短経路問題を解決するための効率的なグラフ探索アルゴリズムです。このアルゴリズムは、グラフの一部を探索し、目的地に最も近いと推定される経路を優先して探索します。Aの重要な特徴は、それが「最適」かつ「完全」であることです。つまり、解が存在すればAはその解を見つけ、その解は最適な解です。 この2つから素直に考えると、Q* とは 解決方法が不明のタスクAを、自律的なトライ&エラーのフィードバックループを用いて探索し、

    Q* の勝手な予想メモ|深津 貴之 (fladdict)
    Ho-oTo
    Ho-oTo 2023/11/25
    Q*がA*を文字っていそうというのは全く気付かなかった/記事内でベクトル空間という語が数学におけるそれとは全く違う意味でサラッと使われているのがだいぶ気持ち悪いかもしれん
  • Javaを中心に偏見ベースでプログラミング言語の関係をまとめた - きしだのHatena

    オブジェクト指向言語の話をするときに便利なように、Javaを中心にプログラミング言語をまとめてみました。 Javaに影響与えるか、Javaから影響を受けるか、という感じですね。 Simula オブジェクト指向はここから始まったと言われています。 クラス、オブジェクト、継承、仮想関数(多態)といった、オブジェクト指向の基要素が備わっていました。 ただし、「オブジェクト指向」という言葉は生まれていません。 Smalltalk Simulaから発想を得て「オブジェクト指向」という言葉を生んだのはアラン・ケイでした。 しかし、モデルとしてはSimulaとは異なりメッセージングを主体としたものでした。また、アラン・ケイの「オブジェクト指向」はプログラミングのパラダイムだけではなく、人がコンピュータをどのように扱うかというメタファであり、ダイナブックというハードウェアやそのユーザーインタフェースを含

    Javaを中心に偏見ベースでプログラミング言語の関係をまとめた - きしだのHatena
    Ho-oTo
    Ho-oTo 2023/11/25
    この手の記事はしょうもないやつが多くてげんなりしがちだが、ちゃんとストーリーの中心となる言語を決めるとシュッとした良い記事になるのだなあ