FLEXY by PKSHA FLEXY by PKSHA

無料登録
株式会社サーキュレーション

募集中 エンタメ業界のプラットフォームにおける音声生成(TTS)モデルエンジニア支援(フルリモート)

社名:非公開

職種:データサイエンティスト
稼働日数:週5日六本木
報酬:〜80万円/月

業務内容 音声生成(TTS)技術の中核エンジニアとして、モデルのFine-tuning・推論最適化からサービス統合まで一気通貫で推進するポジションです。
エンタメ業界のプラットフォームで、世界に通用する音声AIの開発に挑戦いただきます。

・TTSモデル(Qwen-TTS、Orpheus等)のFine-tuning、話者/感情制御の実装
・GPU上での推論効率化(バッチング、KV cache、量子化、同時実行数チューニング)
・音素タイムライン生成のTTSパイプラインへの統合(アバターのリップシンク等への応用)
・推論基盤の構築・運用、レイテンシ(TTFS)とサービス品質の管理

■募集背景
人員不足のため。
勤務地

六本木

必須要件 ・TTSモデル(Qwen-TTS、Orpheus、VITS、Fish-Speech等)のFine-tuning・追加学習の実務経験
・話者適応・感情/プロソディ制御・多言語対応などのカスタマイズ経験
・音声データセットの構築・前処理パイプラインの開発経験
・PyTorchでのモデル学習、LoRA等の効率的Fine-tuning手法の実装経験
・GPU上での推論最適化の実務経験
・推論基盤(vLLM、TensorRT-LLM、SGLang等)の選定・導入・最適化経験
・同時実行数チューニング、レイテンシ改善の実務経験
・CUDA最適化、メモリ効率化に関する深い理解
・REST API/WebSocket/gRPC設計、ストリーミング音声配信の実装経験
・推論サービスのレプリカ構成、オートスケーリング、監視・可観測性基盤の構築経験
歓迎要件 ・音素タイムライン生成をTTSに統合した経験
・リアルタイム音声対話・AIアバターのリップシンク等の開発経験
・日本語能力検定1級、英語ビジネス会話レベル
・BigTech、音声AI特化企業でのTTS/音声生成モデルの開発・運用経験

担当者コメント

ご自身の経験を活かして、ご活躍いただけます。

コーディネーターがさらにご希望や状況に合った案件をお探しすることも可能です。お気軽にお問い合わせください。

PICK UP

LANGUAGE

FRAMEWORK

CLOUD

OCCUPATION

AI戦闘力レーダー あなたのAIスキルを可視化

AIスキル診断を始める
AI戦闘力レーダー あなたのAIスキルを可視化

あなたの市場価値をズバリ判定!AI時代を勝ち抜く武器を見つけませんか? 5つの質問に答えるだけで、あなたの強みと理想のキャリアパスが明らかに。
診断結果に合わせて「あなただけのAIスキルキャラクター」も生成されます。
まずは1分、あなたの可能性を覗いてみましょう!