サクサク読めて、アプリ限定の機能も多数!
“解釈可能な特徴を抽出するためのスパース オートエンコーダ (SAE) を使用した機械的なLLM解釈可能性に関する研究を再現しようとしている。このプロジェクトは...完全なパイプラインを提供することを目指している。”
misshiki のブックマーク 2024/11/22 14:07
GitHub - PaulPauls/llama3_interpretability_sae: A complete end-to-end pipeline for LLM interpretability with sparse autoencoders (SAEs) using Llama 3.2, written in pure PyTorch and fully reproducible.[自然言語処理]“解釈可能な特徴を抽出するためのスパース オートエンコーダ (SAE) を使用した機械的なLLM解釈可能性に関する研究を再現しようとしている。このプロジェクトは...完全なパイプラインを提供することを目指している。”2024/11/22 14:07
このブックマークにはスターがありません。 最初のスターをつけてみよう!
github.com/PaulPauls2024/11/22
Modern LLMs encode concepts by superimposing multiple features into the same neurons and then interpeting them by taking into account the linear superposition of all neurons in a layer. This concep...
8 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /
“解釈可能な特徴を抽出するためのスパース オートエンコーダ (SAE) を使用した機械的なLLM解釈可能性に関する研究を再現しようとしている。このプロジェクトは...完全なパイプラインを提供することを目指している。”
misshiki のブックマーク 2024/11/22 14:07
このブックマークにはスターがありません。
最初のスターをつけてみよう!
GitHub - PaulPauls/llama3_interpretability_sae: A complete end-to-end pipeline for LLM interpretability with sparse autoencoders (SAEs) using Llama 3.2, written in pure PyTorch and fully reproducible.
github.com/PaulPauls2024/11/22
Modern LLMs encode concepts by superimposing multiple features into the same neurons and then interpeting them by taking into account the linear superposition of all neurons in a layer. This concep...
8 人がブックマーク・2 件のコメント
\ コメントが サクサク読める アプリです /