お知らせ一覧に戻る
2026.03.10

クローズド環境で音声分析とAI基盤を連携させる取り組みを開始

— 株式会社ノウデルのAI活用への取り組み —

近年、ChatGPTをはじめとする大規模言語モデル(LLM)の活用が広がる一方で、コールセンターの通話や商談録音といった音声・会話データをどう活用するかも、企業にとって重要なテーマになりつつあります。文字起こしや感情分析、要約・レポート生成までを社内で一気通貫で扱いたいというニーズは、とくに機密性の高い業種で強く聞かれます。

しかし実際には、音声データの活用にあたって次のような課題があります。

  • 通話や商談音声を外部クラウドに送信できない
  • 文字起こし・感情解析・要約までを社内で完結させたい
  • すでに稼働している社内のAI基盤(LLM・RAG・チャット)と連携させたい

こうした背景から、株式会社ノウデルでは、クローズドネットワーク環境で利用可能なRAG型AI基盤前回ご紹介した取り組み)に加え、音声分析システム「ボイテキ2!」の設計を進めています。今回は、既存のAI基盤と同じ環境で"同居"させる構成で、音声を社外に出さずに活用する取り組みの概要をご紹介します。

ボイテキ2! 音声分析システム「ボイテキ2!」とは

今回設計を進めているボイテキ2!は、オンプレミス環境で動作する音声分析システムです。処理の流れはおおまかに次のとおりです。

音声・動画の取り込み → 文字起こし(STT) → 感情解析(SER) → 発話と感情のマージ → 要約・レポート生成(LLM)
  • 結果は解析一覧・詳細画面で確認でき、発話本文・感情の変化・音声再生を連動して確認できる構成を想定しています。
  • 経営者・営業・品質管理・人事など役割ごとの視点(レンズ)で同じ解析結果を見られるようにし、業務に応じた活用を目指しています。

重要なのは、音声と解析結果をすべて社内に閉じたまま利用できる点です。機微な通話データをクラウドに送らず、社内のLLMやRAGと組み合わせて、要約やチャット検索までをクローズド環境で完結させることを目指しています。

連携 既存AI基盤との"同居"構成

当社では、LLM・RAG・チャットUIを備えたRAG型AI基盤(FUJI RAG)をすでにDockerで運用しています。今回のボイテキ2!は、その環境に新たに1システムとして相乗りさせる形で設計しました。

既存AI基盤から利用するもの

LLM(要約・レポート生成)とチャットUI(解析結果を自然言語で検索)は、既存のFUJI RAGをそのまま利用します。将来的には、音声解析の結果をRAGに登録し、既存のチャット画面から検索できるようにする予定です。

ボイテキ2!側で完結するもの

音声の取り込み、文字起こし・感情解析の制御、解析結果の保存、一覧・詳細のAPI、音声の再生配信などは、ボイテキ2!専用のデータベースとストレージで完結させます。既存のAI基盤のデータベースには触れません。

既存システムに影響を与えない取り決め

別のDockerプロジェクト名・別ポートで起動し、既存のAI基盤の設定は変更しない方針にしています。「既存をいじらず、必要な機能だけを追加する」ことを意識した構成です。

環境 コンテナ化とオンプレサーバー

今回の構成では、アプリケーションに加え、データベースやオブジェクトストレージ(S3互換)、文字起こし・感情解析エンジンもコンテナ化する方針としています。これにより、再現性の確保やリソースの分離、バージョン管理がしやすくなります。

本番環境では、AI推論や音声処理に適したオンプレサーバーを想定しており、クローズドネットワーク内で音声の取り込みから解析・要約・チャット連携までが完結する構成を目指しています。前回ご紹介したRAG型AI基盤と同一のネットワーク上で動作させ、社内データを外部に送信しない運用を前提としています。

セキュリティ セキュリティ・アクセス制御

企業環境で音声分析を導入する際には、どのデータを誰が参照できるかの制御が重要です。今回の設計では、次のような仕組みを取り入れています。

  • ユーザーのロール(役割)に応じたアクセス制御
  • 役割別レンズによる表示内容の切り替え(経営者向け・営業向け・品質管理向けなど)
  • 音声の再生のみ許可し、ダウンロードは提供しない方針(情報漏洩リスクの低減)

これにより、セキュリティ要件を満たしつつ、部署や役割に応じた音声データの活用を目指しています。

実務 設計で意識していること

音声分析システムの構築では、文字起こしや感情解析の精度に加え、既存のAI基盤との連携のしやすさが実務上重要になります。今回の設計では、次の点を意識しています。

  • 文字起こし(Whisper系)や感情解析エンジンは別コンテナとして用意し、必要に応じてモデルの差し替えやスケール調整がしやすい構成にする
  • 解析結果の状態管理(処理中・完了・一部失敗など)を明確にし、運用時の確認や再実行がしやすいようにする
  • 画面はモダンなデザインレスポンシブ対応を必須とし、発話・感情グラフ・音声再生が連動する3ペイン構成で、効率的な確認ができるようにする

これらの方針をもとに、実務で使いやすい音声分析基盤の実装を進めていく予定です。

今後 今後の展開

株式会社ノウデルでは、今回の取り組みを通じて以下のテーマに取り組んでいきます。

  • クローズド環境での音声分析とRAG型AI基盤の連携
  • 役割別レンズや感情イベントを活かした業務向けレポート・ダッシュボードの拡充
  • 文字起こし・感情解析のコンテナ化と運用の安定化

音声・会話データの活用は、コールセンターや営業、人事・研修など、多くの業務領域でニーズが高まっています。その中でも、社内データを外部に送信せず、既存のAI基盤と連携して活用できる環境は、企業にとって重要なテーマの一つです。株式会社ノウデルでは、引き続きクローズド環境に適したAI・音声活用の研究・開発を進め、実務で使える基盤の構築を目指していきます。

お気軽にご相談ください

クローズド環境での音声分析・AI基盤連携のご検討は、ぜひお気軽にご相談ください。

お問い合わせ