何をやっているか
【なぜ募集しているのか】
私たちは「テクノロジーですべての人が誇りを持てる社会を」をビジョンに掲げ、最先端のAIを搭載したアプリケーションを世に届ける活動をしています。
その中でも、AI議事録ソフトウェア「SecureMemo」は、
- 世界最高水準の精度96.2%の音声認識AI
- AI議事録ツールとして日本初のオフラインAI要約機能
を特徴に、公共セクターを中心に急速に導入件数が拡大しています。
生成AIのブレークスルーにより「膨大なGPU」が前提になりがちですが、
実際の現場では、GPUや高スペックPCの導入は容易でないことがほとんどです。
そこで今回、“メモリ8 GB未満・CPUだけで使える小型LLM” と
“日本語で形式を守って要約できる賢さ” の両立に挑みます。
目標を達成したLLMを開発できれば、SecureMemoの要約機能としてすぐに社会実装に移ります。
世界的にも前例が少ないチャレンジに早期から関わり、
学術インパクトと社会実装を同時に体験できる エンジニアを求めています。
お願いしたいこと
【取り組んでいただく業務】
「要約タスク等を目標に出力形式へ高精度に追従する数Bサイズ日本語LLM」
開発の中核メンバーとして、下記に携わっていただきます。
1. **データセット構築**
- 公開コーパス+自社議事録データを用いた形式制御プロンプトの合成データ生成
- 形式遵守率・ROUGE‑Lを自動算出する評価パイプラインの設計
2. **モデル開発・追加学習**
- 数Bパラメータ級LLMのLoRA/QLoRAによる軽量ファインチューニング
- 8 GB RAM・CPU環境で推論可能となる量子化・蒸留実装
3. **ベンチマーク整備・実験**
- 日本語文字起こし→要約ベンチマークの作成、学会発表も視野に入れた指標検討
- GPU少数ノードでの効率学習スクリプト整備
4. **プロダクト組込み・フィールドテスト**
- オンプレミス議事録ツール「SecureMemo」への統合
働く環境・業務に使うツール
-プログラミング言語
- Python
- AI / ML
- 数B〜数十BオープンLLM(Gemma, Phi, Mistralなど)、クローズドLLM
- LoRA・QLoRA・PEFT
- 音声認識、話者認識
- 軽量化 / 分散学習
- BitsAndBytes, Flash‑Attention‑2, DeepSpeed, FSDP
- 評価 / 監視
- Langfuse, Weights & Biases, Rouge‑score, custom format‑score
- DevOps
- GitHub Actions, Docker
- クラウド / インフラ
- AWS(EC2, S3, EKS)
- プラットフォーム
- Linux(Ubuntu), Windows(WSL2対応)
募集詳細情報
ご登録いただくと、プロジェクトの応募条件を
ご覧いただけます。