募集中 エンタメ業界のプラットフォームにおける音声生成(TTS)モデルエンジニア支援(フルリモート)
社名:非公開
職種:データサイエンティスト
稼働日数:週5日六本木
報酬:〜80万円/月
| 業務内容 | 音声生成(TTS)技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進するポジションです。 エンタメ業界のプラットフォームで、世界に通用する音声AIの開発に挑戦いただきます。 ・TTSモデル(Qwen-TTS、Orpheus等)のFine-tuning、話者/感情制御の実装 ・GPU上での推論効率化(バッチング、KV cache、量子化、同時実行数チューニング) ・音素タイムライン生成のTTSパイプラインへの統合(アバターのリップシンク等への応用) ・推論基盤の構築・運用、レイテンシ(TTFS)とサービス品質の管理 ■募集背景 人員不足のため。 |
|---|---|
| 勤務地 |
六本木 |
| 必須要件 | ・TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験 ・話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験 ・音声データセットの構築・前処理パイプラインの開発経験 ・PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験 ・GPU上での推論最適化の実務経験 ・推論基盤(vLLM、TensorRT-LLM、SGLang等)の選定・導入・最適化経験 ・同時実行数チューニング、レイテンシ改善の実務経験 ・CUDA最適化、メモリ効率化に関する深い理解 ・REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験 ・推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験 |
| 歓迎要件 | ・音素タイムライン生成をTTSに統合した経験 ・リアルタイム音声対話・AIアバターのリップシンク等の開発経験 ・日本語能力検定1級、英語ビジネス会話レベル ・BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験 |
担当者コメント
ご自身の経験を活かして、ご活躍いただけます。