Excelなどの“表計算ソフト専用”の大規模言語モデル　米Microsoftが「SpreadsheetLLM」発表：Innovative Tech（AI+）

» 2024年07月17日 12時00分公開

[山下裕毅，ITmedia]

Innovative Tech（AI+）：

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。

X：＠shiropen2

　米Microsoftに所属する研究者らが発表した論文「SpreadsheetLLM: Encoding Spreadsheets for Large Language Models」は、表計算ソフトを理解するための効率的な大規模言語モデル（LLM）を提案した研究報告である。

SpreadsheetLLMのパイプライン

　MicrosoftのExcelやGoogleのスプレッドシートなど表計算ソフトは広く使用されているが、その二次元の格子構造や複雑なレイアウト、多様なフォーマットオプションなどが、LLMにとって大きな課題となっている。今回提案するフレームワーク「SpreadsheetLLM」は、これらの課題を解決する。

　このフレームワークの中核を成すのが「シートコンプレッサー」という手法である。シートコンプレッサーは3つの主要機能を持つモジュールで構成しており、まずは表計算シート内で重要な構造を持つ部分を特定する機能だ。これにより、重要な構造情報を保持しつつ、データ量を大幅に削減できる。

　次に、データの表現方法を変更だ。従来の行と列による格子状の表現から、値をキーとし、その値が存在するセルの位置をインデックスとする辞書形式に変換する。この方法により、空のセルは除外でき、同じ値を持つ複数のセルをまとめて表現し、重複を減らすことが可能になる。

　最後に、数値データの扱いを効率化する。隣接するセルでは、多くの場合同じようなデータ形式（例：日付、通貨、パーセンテージなど）が使用されている。この手法では、セルの具体的な数値ではなく、そのデータ形式や型を抽出し、同じ形式を持つセル群をまとめて表現。これにより、数値データの分布や傾向を効率的に表現しつつ、個々の数値を記録するよりも大幅にデータ量を削減できる。

シートコンプレッサーの説明

　これら3つの手法を組み合わせることで、シートコンプレッサーは表計算データを平均して25倍にも圧縮することに成功。この圧縮により、LLMが一度に処理できるデータ量が大幅に増加し、より大規模で複雑な表計算ファイルの分析が可能となった。同時に、データ処理にかかる計算コストも96％削減されており、実用面でも大きな進歩をもたらしている。

　表計算検索タスクにおいて、実験の結果、このフレームワークは従来の最高性能モデルを12.3％上回る性能を達成した。特に大規模な表計算シートにおいて、その性能向上が顕著であった。表計算QAタスクにおいても、ベースラインのGPT-4モデルと比較して22％の精度向上を達成した。

Source and Image Credits: Yuzhang Tian, Jianbo Zhao, Haoyu Dong, Junyu Xiong, Shiyu Xia, Mengyu Zhou, Yun Lin, Jose Cambronero, Yeye He, Shi Han, Dongmei Zhang. SpreadsheetLLM: Encoding Spreadsheets for Large Language Models.

AI「はっきりしませんが……」　“自信がないAI”に人はどう反応する？　米Microsoftらが400人以上で実験
米プリンストン大学とカナダと米国のMicrosoftに所属する研究者らは、自信がない回答をする大規模言語モデル（LLM）に対して人々はどう反応するかを調査した研究報告を発表した。
「生成AIを日常的に使う時代が来た」──AI処理に適したWindowsパソコン「Copilot+ PC」18日発売
日本マイクロソフトは6月18日、Windows PCの新しいカテゴリーで、AI処理に最適化したPC群「Copilot+ PC」製品を発売する。記者向けに開いた製品説明会では「生成AIを日常的に使う時代が来た」とアピールした。
“大は小を兼ねない”生成AI　注目集める「小規模言語モデル」（SLM）　そのメリットとは？
先日行われた、米Microsoftの開発者向けイベント「Microsoft Build 2024」の目玉の一つだった「SLM」（Small Language Model）。そもそもSLMとは何か？　何が期待されているのか？　SLMの基本を整理する。
Xbox Game Pass値上げへ　既存ユーザーは9月から
Microsoftは、オンラインゲームのサブスクサービス「Xbox Game Pass」の料金を値上げすると発表した。新規ユーザーは7月10日から、既存ユーザーは9月12日以降の次回請求分から適用される。
不足する「AI人材」　社会は変わる、学生はどうする？
AWSが、AIスキルの人材育成に対して新たなプログラムを発表した。同社は技術への投資はもちろん、人材育成として社会人への教育プログラムにも力を入れてきたが、それは当然これまでのAWSのビジネスに直結するクラウドスキルに関するものが多かった。その教育プログラムに、AIを学べるものが加わった格好だ。