大規模なエンタメプラットフォームにおける最先端の音声合成(TTS)モデルの開発や推論最適化を主導していただきます。
モデルの追加学習やカスタマイズから、GPU環境での効率化、
サービスへの統合にいたるまで一連の工程に携わることができるポジションです。
【仕事内容】
下記の業務を担っていただく想定です。
・音声合成モデルを用いた追加学習や話者・感情の制御機能の実装
・GPU環境におけるバッチ処理やキャッシュ管理、量子化などによる推論の効率化
・リップシンクなどへの応用を見据えた、音素タイムライン生成機能のシステム統合
・推論基盤の設計・運用、および応答速度やサービス品質の管理
※詳細は面談時にお伝えします。
・音声合成モデルを用いた追加学習や実務での開発経験
・話者適応、感情制御、多言語対応などのカスタマイズ経験
・音声データセットの構築や前処理システムの開発経験
・PyTorchを用いたモデル学習や、効率的な追加学習手法の実装経験
・GPU環境における推論最適化(バッチ処理、キャッシュ管理、量子化、ストリーミング生成)の実務経験
・推論基盤(vLLM、TensorRT-LLMなど)の選定、導入、最適化の経験
・同時実行数の調整や応答速度の改善に関する実務経験
・CUDAの最適化やメモリ効率化に関する深い知見
・REST API、WebSocket、gRPCの設計や、ストリーミング配信の実装経験
・推論サービスの冗長化、自動拡張、監視基盤の構築経験
・音素タイムライン生成を音声合成システムへ統合した経験
・リアルタイムでの音声対話やアバターのリップシンクなどの開発経験
・日本語能力試験1級相当の語学力、またはビジネスレベルの英語力
・大手IT企業や音声AI専門企業における音声合成モデルの開発・運用経験
・独自のデータや事業領域に関心を持ち、新しい価値の創出に貢献する意欲のある方
・難易度の高い課題に対しても、粘り強く研究開発を推進できる方
・自律的に行動し、未知の領域にも積極的に挑戦できる方
・組織内外との円滑な連携を通じて、プロジェクトを推進できる方
1回
オンライン
Win/Mac どちらか
非公開非公開非公開非公開非公開
非公開
非公開
非公開
非公開
非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開
非公開
非公開
非公開
非公開
非公開非公開非公開非公開非公開非公開非公開
非公開非公開非公開
非公開
非公開非公開非公開
非公開
非公開非公開非公開非公開非公開非公開非公開非公開
非公開非公開非公開非公開
多くの案件を取り扱っている企業でございます。
こちらのPJが終了しても別のPJにジョインできる可能性がございます。
人気案件の場合、早期に募集が終了する可能性がございます。お早めのご登録とエントリーをお勧めいたします。
何かお悩みやご相談がある場合は、「個別相談会」や「お問い合わせ」からお気軽にご連絡ください。