次世代LLM研究 ― タスク特化軽量LLMの社会実装を担うLLMエンジニア募集

何をやっているか

【なぜ募集しているのか】

私たちは「テクノロジーですべての人が誇りを持てる社会を」をビジョンに掲げ、最先端のAIを搭載したアプリケーションを世に届ける活動をしています。

その中でも、AI議事録ソフトウェア「SecureMemo」は、

- 世界最高水準の精度96.2%の音声認識AI
- AI議事録ツールとして日本初のオフラインAI要約機能

を特徴に、公共セクターを中心に急速に導入件数が拡大しています。

生成AIのブレークスルーにより「膨大なGPU」が前提になりがちですが、
実際の現場では、GPUや高スペックPCの導入は容易でないことがほとんどです。

そこで今回、“メモリ8 GB未満・CPUだけで使える小型LLM” と
“日本語で形式を守って要約できる賢さ” の両立に挑みます。

目標を達成したLLMを開発できれば、SecureMemoの要約機能としてすぐに社会実装に移ります。
世界的にも前例が少ないチャレンジに早期から関わり、
学術インパクトと社会実装を同時に体験できるエンジニアを求めています。

お願いしたいこと

【取り組んでいただく業務】

「要約タスク等を目標に出力形式へ高精度に追従する数Bサイズ日本語LLM」
開発の中核メンバーとして、下記に携わっていただきます。

1. **データセット構築**
- 公開コーパス＋自社議事録データを用いた形式制御プロンプトの合成データ生成
- 形式遵守率・ROUGE‑Lを自動算出する評価パイプラインの設計
2. **モデル開発・追加学習**
- 数Bパラメータ級LLMのLoRA／QLoRAによる軽量ファインチューニング
- 8 GB RAM・CPU環境で推論可能となる量子化・蒸留実装
3. **ベンチマーク整備・実験**
- 日本語文字起こし→要約ベンチマークの作成、学会発表も視野に入れた指標検討
- GPU少数ノードでの効率学習スクリプト整備
4. **プロダクト組込み・フィールドテスト**
- オンプレミス議事録ツール「SecureMemo」への統合

働く環境・業務に使うツール

-プログラミング言語
- Python
- AI / ML
- 数B〜数十BオープンLLM（Gemma, Phi, Mistralなど）、クローズドLLM
- LoRA・QLoRA・PEFT
- 音声認識、話者認識
- 軽量化 / 分散学習
- BitsAndBytes, Flash‑Attention‑2, DeepSpeed, FSDP
- 評価 / 監視
- Langfuse, Weights & Biases, Rouge‑score, custom format‑score
- DevOps
- GitHub Actions, Docker
- クラウド / インフラ
- AWS（EC2, S3, EKS）
- プラットフォーム
- Linux（Ubuntu）, Windows（WSL2対応）