エンタープライズDX
KKCompany Japan
マルチモーダルAIが実現する
会議動画の効率活用
会議にかかわる課題を抱える企業に向け、KKCompany Japanはマルチメディア対応AIプラットフォーム「BlendVision AiM」を提供している。会議動画のテキストや画像、音声などの情報を統合して分析するマルチモーダルAI機能を搭載し、ワンクリックで視聴したいシーンの分割や要約の生成を行う。長い会議動画を効率的に振り返り、会議のDX化を促進する。
会議には様々な課題がつきまとう。数が多くて振り返りや情報共有が不十分。議事録だけでは分からない部分を参加者に確認し直す。議事録作成に時間・労力をかける人的リソースが不足している、などなど。「こうした会議にかかわる課題をAIの力で解決するのが『BlendVision AiM』です。当社が得意とする動画技術とAI技術を組み合わせ、会議録画データから、必要な情報を抽出します」と、KKCompany Japanの福田恭司氏は説明する。
使い方は簡単だ。会議動画や資料などの情報をBlendVision AiMのクラウドにアップロードする。その情報に対してAIが解析を行い、情報を取り出せるように整理する。 そして、ユーザーは知りたい情報をチャットボットに質問するとAIが必要な情報を抽出・要約する仕組みだ。
BlendVision AiMは、汎用的なAIチャットツールと異なり、回答をAIが生成するだけでなく、回答の根拠となる動画やテキストを提示するので、回答内容の真偽を即座に確認できることも特徴となっている。
文字や画像、音声を組み合わせ
動画分析を行うマルチモーダルAI
BlendVision AiMは、会議動画の視聴を効率化する「AIクイック分析機能」を搭載している。視聴する端末画面のボタンをワンクリックするだけでタグ付け、シーン分割、シーンごとの要約生成などをAIが自動的に行い、目的の動画を時間をかけることなく探し出すことができ、効率的な振り返りが可能だ。
このAIクイック分析を可能にするのが、AIによるマルチモーダルの動画分析だ。会議動画内のテキストや画像、音声など複数種類のデータを統合して処理し、総合的に分析する。「これにより、人間のように内容を理解し、動画から必要なシーンの抽出や文字起こしなど、様々なアウトプットが可能です」(福田氏)
また、会議で話者がホワイトボードなどに書いた文字(例えば1、2、3)を指さしながら「これ」や「あれ」といった説明をすることがある。音声のみの解析の場合、文字起こしの際にも「これ」や「あれ」と表示される。だが、BlendVision AiMなら会議動画の視覚情報を解析し、動画内の「1、2、3」という文字情報を読み取って表示する。より正確な理解の手助けとなる。
BlendVision AiMの機能拡張として、計画されているのが「ネオ議事録」だ。会議の録画を取り込むだけで会議の概要やアクションアイテム、決定事項、質問事項、発言内容の文字起こしなどをAIが自動で生成する。内容の詳細を確認する場合は会議録画のシーン分け・タグ付けなどですぐ見つけられる。
「AIの力を活用することで会議の参加人数を絞り込むことも可能です。また、議事録作成時間の短縮など、会議にかける人的リソースを最適化し、企業の課題である会議のDX化を促進します」と福田氏は述べた。
お問い合わせ
- KKCompany Japan合同会社
- URL:https://www.kkcompany.com/ja-jp