コンニチハ、オイソギデスカ
思ったより読まれてたので、ブコメにも出てたRAGの話を派生編として書いておくね。
最初に結論から、RAG案件は受けるな。(コンサルみたいにタイムチャージで儲かるなら別)
※前回もそうなんだけど、いわゆるTrap streetは直接指摘しないで二ヤ二ヤしてくれな。概要把握できないほど変なことは書いてないよ。
RAGを必要とする組織は必要なデータ運用ができておらず、必要なデータ運用ができている組織にRAGは不要だから。
まず前提からな。
例えば、郵便番号で考えたらわかるんだけど、郵便番号データベースを参照させて生成AIから引っ張ってくるときに問題になることはなんだ?
当たり前だけど、大前提ね
郵便番号なら、市区町村とか、番地枝番とか、全部統一された規格で揃ってないとね。
例えば、「姉小路通柳馬場東入って何番?」は、「604-8103です」って返せるけど、
「604-8103に手紙出したいんだけど、住所書いてくれない?」で、「姉小路通柳馬場東入」と「柳馬場通姉小路下る」のどっちを普通書くよね、みたいなのは出てこない。
だって、京都に住んでる人の機嫌を損ねないための生成AIになってないもん。
ありがちだけど、「本社の郵便番号って何番だっけ?」みたいなやつとかね。
存在しない番号をチェックできるなら、最初からチェック用のデータベース叩きに行かない理由がいるよね。
ここまで前提ね。
まあ、郵便番号くらいガッツリ目に世の中に存在するものだったらやりようはあるんだけど。
ドキュメントはあるんだけど、検索が大変でどこにあるかすぐ探せなくてねーみたいなやつね。
RAGには向かないです。それドキュメントのメンテできてないから。
何が正しくてどれが最新で、誰が管理しててどこまで見せて良いか管理できていないからそういうことになってる。
このドキュメントは管理職以上にしか見せちゃダメね、これはこの部署のみ、これは部外秘、みたいな状況で散乱してたりする。
RAGには向かないです。やろうとしてることがデータ運用組織体制改善でRAGと関係なくなっちゃってるから。
これはまあ余録かな。作って納品するだけだったら検修通れば良いんだもんね。
まあ、そういう要件に限ってフワフワのままゴールがフラフラして大変なことになるんだけどね。
RAG入れたいっていうところ、社内全文検索エンジンとかが流行った頃に導入できてないか導入してもうまく検索できてない組織がほとんど。
そんで、そういう組織がRAGを適切に使えるようになるためには、まず全文検索エンジンでも引っ張ってこれるように整備する必要がある。
しかも、今後その組織で作られる情報全ての運用をそれに組み込まないとあっという間に陳腐化する。
その予算使って、まともなFAQサイト作ったり、社内司書みたいな業務区分作った方が幸せになれると思うよ。
多少盛ったり話を作って辻褄合わせても問題なくて、ある程度の専門性や社外秘の情報が必要で、柔軟な窓口対応を求められるところ。
社内雑談チャットbot、かな。(喫煙所の会話ができるマシーン)
これってさー、普通には予算降りないよね。社内で研究した結果の応用とかで社内発表するならまだしも外に委託する内容じゃないわな。
逆にアダルティーな感じのお店でのチャットbot運用ならワンチャンあるかも?
逆にいうと、これができていない組織にRAGはハマらないです。できている組織にRAGがいるかって言われると、ね。
だから、今からRAGの話が上がるような組織に対して案件を受けるのはやめておけ。
RAGにハマる(まともな)ユースケースもあるにはあると思うよ。
膨大な社内文書が整然と揃ってるけど、利活用時には個別具体的にカスタマイズする必要があって、社員の皆さんが多大な労力を費やしている職場。
文書を検索して整形して相手に合わせてカスタマイズする業務ね。思い当たるでしょうこちらの先進医療保健特約はつけるだけでとか、ドル建て債券は非常に安定度が高くとか。
そういうところはね、その業務が金の卵だって知ってるから余程のアレな会社以外は自力で整備するよ。だから今RAGとかいう会社はみんなアレなんだ逃げろ。
(家庭内WikiをRAGで柔軟に検索させるときに音声入出力すると未来感あるぞ(実用性があるかは人によるし儲かんないけど))
コンバンハ、オイソギデスカ 今日も上司の思いつきで無茶振りされる皆さんお疲れ様です。 DeepSeekみたいな話題が日経新聞に載るたびに新規事業になるんじゃ無いかとかプロトタイプを...
コンニチハ、オイソギデスカ 思ったより読まれてたので、ブコメにも出てたRAGの話を派生編として書いておくね。 最初に結論から、RAG案件は受けるな。(コンサルみたいにタイムチャー...
生成AIの仕事全般、受託開発で受けない方がいいでしょ。 プロジェクトがぐだぐだになる要素が多すぎて、検収困難になる。 UIとAPIの繋ぎこみだけ担当します、結果何が出てきても一切...
こーゆーので「しんきじぎょうだ!」とかゆっちゃう上司ってPay〇ayクーポンで100円のためにハンバーガー屋で2時間ならびそう
言い得て微妙
一方、俺はDeepSeekのアカウントさえ作れずに泣いていた。 メアドで弾かれるんだけど、なんでだ?
API使うという選択肢はないんか
この増田の直後に「MSがAzureにDeepSeek R1をデプロイして蒸留モデルをCopilot+ PCに搭載するで」って言い出して草
脱OpenAIを進めているのは分かっていたがそこまでとはな・・・😎
てか、この話題を突き詰めると、『OpenAIのo1に匹敵すると自称するAIが、o1の1/30位の値段で使える』以上の話ではないはずなんだけど、まるで『ChatGPT3.5発表に匹敵する世紀の大発明』...
>低コストで高性能なAIモデル、オープンソースで実現--開発コストは約7万円 - ZDNET Japan https://japan.zdnet.com/article/35228433/ >Sky-T1-32B-Previewはオープンソースで、8基のNVIDIA製GPU「NVIDIA H100」を...
この怪文書になんでブクマ付けたの?
設備投資もランニングコストも、日本のベンチャーとかじゃまともな勝負にはならんでしょ。 「日本のベンチャー」って具体的には何と何を比べてるの? アメリカの話か中国の話か...
PFN!
インフラのコストでなく技術開発力でないの 中国やアメリカが広いといってもド田舎にインフラ作ると苦労することは変わらん
日本終わった論者って、昔の経済大国だった時代の日本と比較してるからそう思うんだよね 今の若者は、日本なんてもともとこんなもんだと思ってるから別に悲観してないよ
なお若者の自殺者過去最多
失われた何十年も生まれた時から失われてたら「元々なかっただけ」って思うやろなあ
国土も山がちで狭けりゃ地震は多いし台風は来るし大した資源もなんもねーもんね 魚が取れるくらい DHAのおかげで世界でも抜きんでて頭がいい国民ってことになってるのかな
2023年夏頃からローカルLLMってHuggingFaceに大量に出てるけど、VRAMが24GBはないと300文字の程度の日本語要約すらできなかったりする。 AWSのEC2で借りてトライしようとしても、VRAMが24GB以上の...
https://anond.hatelabo.jp/20250129194915 生成AIを提供する某社で働いている。 昨今DeepSeekショックというかDeepSeekでショックを受けた顧客から色々言われるのでものを申したい。 Azure経由でChatGPT...
興味ないね
「話題が日経新聞に載るたびに新規事業になるんじゃ無いか」あ~。 経営者にも新人にも日経新聞は禁止したほうがいいとおもうやで ビジネスパテントのとき当業界がどんだけ踊らされ...
シンガポール経由でNVDAのプロセッサ買ってる説はどう?