退出登录
取消
  • 製品価値
  • 製品機能
  • 製品強み
  • 活用シーン
  • 導入事例
製品価値
PRODUCT VALUE
  • 統合型モデル学習・推論
    • モデルの微調整、最適化、デプロイ・推論、評価までをワンストップで提供
    • 従来の手作業に比べ、時間コストを50%以上削減
  • モデル推論高速化
    • 複数の量子化高速化手法を採用
    • 既存アプリのモデルをFP8量子化することで、遅延を約34.8%低減
  • GPU共有スケジューリング
    • 1枚のアクセラレータ上で複数のモデルサービスを必要に応じて実行可能
    • GPU利用率を高め、リソースの無駄を削減
  • 異種モデル統合管理
    • 自社モデル、パブリッククラウドモデル、オープンソースモデルを一括管理
    • OpenAPIによる標準化インターフェースを採用
  • 分散学習
    • パラメータ650億超の大規模モデルに対応
    • 65Bモデルを64枚カードで分散学習し、学習時間を75%削減。従来5時間から75分に短縮
  • 国産環境対応&可観測性
    • ファーウェイ昇騰NPU、ハイグアンDCUなど国産アクセラレータ上でモデル学習・推論に対応
    • 多次元監視を実装し、分単位で異常へ対応・修復可能

豊富な実践SOPを備え、業界と業務に深く対応

今すぐ登録で14日間無料トライアルをご利用いただけます
企業のサービス・マーケティングのデジタル化推進を支援
今すぐ利用開始

モデルトレーニングプラットフォーム

エンタープライズ向け大規模モデル開発基盤
ワンストップで学習・推論・評価の全工程を簡素化

  • 大規模モデルの学習・推論・高速デプロイを統合
  • 学習の難易度、高コスト、人材不足といった課題を解決
  • 企業が迅速に大規模モデル基盤を構築できるよう支援

製品価値

  • リソースの無駄を削減、GPU共有スケジューリング
  • 多次元監視を実装、分単位で異常復旧可能
  • OpenAPIによる標準化、異種モデルを一括管理
  • ファーウェイ昇騰NPU、ハイグアンDCUなど国産環境に対応
  • モデル学習・推論を統合、時間コストを50%以上削減
  • 推論を高速化、FP8量子化により遅延を34.8%低減
  • 65Bモデルを64カードで分散学習、学習時間を75%短縮

製品機能

bianzu171beifen57.png

大小モデル統合学習・推論

  • リソースが限られた環境や迅速な対応が必要な場面において、ワンストップサービスを提供し、モデルの学習・推論コストを大幅に削減します。
bianzu171beifen52.png

モデル量子化圧縮

  • モデル量子化技術によりGPUリソースの利用を最適化し、多様なAI活用シーンに対応、リソースを高効率で活用します。
bianzu171beifen53.png

Tritonエンジン推論高速化

  • モデルパラメータをGPU命令に対応するバイナリファイルに変換・コンパイルし、実行時の演算効率を高めます。
bianzu171beifen55.png

GPU仮想化

  • ビデオメモリ、ストリームプロセッサ、テクスチャユニットなど物理GPUリソースを複数の仮想マシンまたはコンテナで共有可能にします。
  • GPU利用率を向上させ、プラットフォームの利用コストを削減します。
bianzu171beifen56.png

動的GPUリソース潮汐スケジューリング

  • システム負荷に応じてリソースを動的に割り当て・回収し、GPUリソースを最大限活用しコストを削減します。
  • リアルタイム対話、電話営業、品質検査、対話分析など多様な業務負荷に対し、潮汐スケジューリング・優先度スケジューリングを適用。GPUを最大活用し、運用コストを抑えます。
bianzu171beifen54.png

モジュール型オンデマンドサービス迅速デプロイ

  • 顧客のニーズに合わせてモジュールを組み合わせ、異なる種類の大規模モデルに対応。迅速に導入・運用を開始し、個別のサービス要件に応えます。

製品強み

初心者向けSFTツール

  • すぐに利用可能な大規模モデル微調整ツール
  • フルパラメータ/LoRA微調整に対応、追加学習も可能

モデル圧縮ツール一式

  • 各種モデル量子化高速化ツールを標準搭載
  • ワンクリックでモデル量子化を実行

モデル推論高速化

  • 独自開発の高性能推論エンジン
  • オープンソース製品と比較し、推論パフォーマンスが30%以上向上

可視化モニタリング

  • 評価レポート、ログ、イベント、演算リソース、API呼び出しを一括可視化
  • 高い可観測性を実現

リソース高効率活用

  • multi_LoRAによるモデルデプロイで複数のモデルを同一エンドポイントで運用、GPUリソースを大幅削減
  • GPU共有ルールをカスタマイズし、柔軟な割り当てでリソースの無駄を抑えます

国産環境対応

  • 異種ハードウェアリソースに対応したスケジューリング
  • NPU・DCU上でモデルの学習・推論が可能
今すぐ登録で14日間無料トライアルをご利用いただけます
企業のサービス・マーケティングのデジタル化推進を支援
好的
现在,就让业务连接起来,驱动业绩增长

扫码添加专属客服