高性能GPU H100利用可能
安心の国産クラウド
最短3分で起動

研究成果に繋がるAI基盤

国産クラウドGPUと生成AIアプリケーションで
研究・開発・実装を一気に前へ。

無料で相談する

SPReAD 1000補助金等
各種研究の補助金申請可能

文部科学省が実施するAI for Scienceによる科学研究革新プログラム AI for Science萌芽的挑戦研究創出事業（SPReAD）他、
NEDO・科研費・AMED・JST など、様々な研究用途にご活用いただけます。

こんな課題はありませんか？

混雑期の計算リソース確保が困難

検査画像や大規模統計データを用いた研究では、学内GPU環境に利用が集中し、学習処理が途中で停止するケースも。
研究スケジュールへ影響が生じることがあります。

機密情報管理の課題

研究データや実験結果などの機密情報を扱う環境では、適切なアクセス管理やデータ保護が不可欠。
安全性を担保できるAI基盤を調達できるかは重要な課題です。

研究費運用・会計処理の課題

研究用途では、年度予算や科研費に合わせた柔軟な予算執行が求められます。
契約形態や支払い条件によっては、大学の会計処理負担が増えることも。

研究開始までの時間的課題

オンプレミスGPUサーバーの場合、研究予算や補助金採択後、調達・発注・納品に時間を要することも。
計算環境の準備待ちが、研究開始の遅れにつながります。

さくらインターネットのGPU・API基盤で解決！

VM型GPUクラウドサービス

NVIDIA GPU H100プラン提供: AIモデルの学習や高解像度データ解析にも対応。
長時間の実験や大規模バッチ処理でも、計算リソースを気にせず研究に集中できます

大学・研究機関向けの会計・運用に対応: 請求書払い・プリペイド方式を利用でき、契約後すぐにGPU環境を利用開始できます。

データは国内格納 × 国内法準拠: 研究データは国内で安全に管理。
国内データセンターでの運用とISMS準拠により、高い機密性が求められる研究用途でも安心してお任せいただけます。

生成AIアプリ開発に最適なAPI基盤

すぐに使い始められる: OpenAI互換APIで、コードや開発フローを大きく変えずに日本語特化モデルやオープンモデルへスムーズに移行できます。

多様な生成AIモデルを低コストで: テキスト生成・埋め込み・音声認識・RAGなど、多様な生成AIモデルのAPIを提供。無償利用枠も用意しており、予備検証から本番運用まで研究規模に応じて柔軟にご利用いただけます。

国内完結の安心基盤: 利用データはモデルの学習に一切使用されず、すべて日本国内のサーバーで処理されます。高度な情報セキュリティやデータ主権が求められる研究用途においても、安心してAIをご活用いただけます。

まずはお気軽にご相談・お問い合わせください

研究用途に合わせてご案内いたします！

無料で相談する

様々な研究・業界で活用されるGPU・生成AI

医療

読影支援向け
医用画像の大量推論

CT・MRI・レントゲン画像を活用した大規模な画像解析・推論研究に対応。異常検知モデルの学習や読影支援AIの検証を効率化。

工学計算・シミュレーション

シミュレーション・数値解析向け大規模計算

流体解析や構造解析などの大規模シミュレーション研究に対応。長時間計算や大規模パラメータ探索を高速化します。

教育・研究

研究データを活用した
カスタムLLM構築

膨大な学術論文や研究データを活用した研究分野特化型LLMの構築・追加学習に対応。研究テーマに関連する知識抽出や要約生成を支援。

農業

リモートセンシング・
農業向け画像解析

ドローン・衛星画像を使った圃場セグメンテーションや病害・異常検知モデルの学習・推論、圃場モニタリングに

小売・EC

商品情報を学習させた
チャットボットの導入

お問い合わせ対応を自動化しながら、24時間対応を実現し、サポートサービスの工数削減に貢献

導入事例

医療AIの社会実装を「高火力DOK」で加速。北海道大学が選んだ信頼と安定感

医療AI研究に高火力 DOKを活用

北海道大学電子科学研究所生体データサイエンス研究分野（藤原幸一研究室）

ローカル環境で使っていた Dockerイメージをそのままクラウドで実行でき、環境調整に伴う手戻りや準備時間が減少。対話的な試行錯誤が可能になり、研究の回転率が大きく向上
学内計算機や共有スパコンに依存せず、必要なときに必要な計算資源を確保可能に
外資クラウドに比べ、データ管理に関する調整・説明コストが大幅に低減

研究サイクルを止めるリソース不足から解放され、研究スケジュールが安定しました！

事例を見る

高火力 VRTでモデル学習を爆速化！仙台高専「WiCON2025」優秀賞の舞台裏に迫る

農業AI・遠隔灌水システム開発に高火力 VRT を活用

仙台高等専門学校 Cyfarma

学習時間を大幅短縮し、1日の試行回数が大きく向上。モデル精度改善の検証を高速化
学内環境では難しかった大規模LLMやGPU学習環境を実現。研究・開発サイクルを効率化
SSH接続のみで利用でき、複雑な環境構築を抑えながら研究開発へスムーズに活用可能

自分のパソコンがそのまま強くなったような使い心地。研究開発に集中しやすい環境でした

事例を見る

ゲノム情報の高速解析と開発体制の強化

ゲノム情報解析の研究開発に高火力 VRTを活用

株式会社テンクー

CPU環境では約9時間かかっていた解析処理が約40分まで短縮。解析の回転率が向上し、全ゲノム解析を見据えた開発イテレーションが大きく加速
必要なタイミングでスケール可能なGPU基盤として整備でき、症例数増加や次世代研究にも耐えられる体制に
日本語サポートと明瞭な請求体系により、費用計画の見通しが安定

高性能GPUを安定利用できる環境を確保できたことで、試行錯誤が活発に行えました！

事例を見る

宇宙データとAIを動かす高火力 VRT

AIモデル開発のGPU基盤として高火力VRT を活用

株式会社Tellus

国内クラウド上でNVIDIA H100 GPUを即時利用できるようになり、大容量の衛星データ処理を安定的に実行可能に
自由度が高くタイムリーに確保できるGPU基盤により、研究開発・事業開発でのAIモデル開発の試行錯誤を加速
国産クラウド基盤により、為替変動・地政学リスク・データ越境の不安を抑えてセキュアなAI学習が可能に

高火力 VRTで「快適なGPU性能」に“安心・安全”を乗せて提供できるようになりました

事例を見る

まずはお気軽にご相談・お問い合わせください

研究用途に合わせてご案内いたします！

無料で相談する

仕様・料金

高火力 VRT

仕様・スペック

	NVIDIA V100	NVIDIA H100
搭載GPU（接続規格）	NVIDIA V100 PCIe 32GB x1	NVIDIA H100 SXM 80GB x1
CPU	4 core	24 core
メモリ	なし	240 GB
一時領域	なし	6.9TiB (NVMe)
ローカル回線※	2.0 Gbps	10.0 Gbps
おすすめの使い方	大規模データ解析やAIモデル学習、長時間の研究計算に最適	大規模AIモデル学習や高速シミュレーション、高負荷な研究用途に最適

グローバル回線は標準の共有セグメント（100Mbps）、およびオプションのルータ＋スイッチ（100Mbps～10,000Mbps）からお選びいただけます。詳しくはマニュアルをご確認ください。
その他、詳しい仕様については、マニュアルをご確認ください。

料金

	NVIDIA V100	NVIDIA H100
時間額	481円	990円
日額	11,550円	23,100円
月額	231,000円	385,000円

NVIDIA V100 は、2027年3月31日をもって提供を終了します。
表示価格は税込です。
時間額、日額、月額は、別々の料金プランではなく、自動スライドによって最適な金額が適用される仕組みです。例えば最初は時間額でご利用を開始したとしても、お客様のご利用状況に応じて、自動的に日額の料金へ切り替わります。
上記に加え、OSやアプリケーションのインストール先として、別途さくらのクラウドのディスクが起動領域として必要になります。なお、ディスク料金は作成から削除までの期間に対して発生します。
料金シミュレーションを使ってご利用料金のシミュレーションができます。なお、料金は定価でのシミュレーションとなります。
期間指定の契約をご希望の場合は営業担当にご相談ください。

さくらのAI Engine

料金体系

「無償リクエスト数」はご利用のモデルにより異なります。詳しくは「提供モデルと料金」をご覧ください。
ご利用中のプランが自動で切り替わることはありません。

提供モデルと料金

カテゴリー	提供モデル	基盤モデル無償プランリクエスト制限内での利用が無料	従量課金プラン無償プランのリクエストを超過した場合
Chat completions	gpt-oss-120b	1ヶ月あたり 3,000リクエストまで	Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
	Qwen3-Coder-480B-A35B-Instruct-FP8		Input 0.3円 / 10,000トークン Output 2.5円 / 10,000トークン
	Qwen3-Coder-30B-A3B-Instruct		Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
	llm-jp-3.1-8x13b-instruct4		Input 0.15円 / 10,000トークン Output 0.75円 / 10,000トークン
Audio transcription	whisper-large-v3-turbo	1ヶ月あたり 50リクエストまで	0.5円 / 60秒
Embeddings	multilingual-e5-large	1ヶ月あたり 10,000リクエストまで	Input 2円 / 10,000トークン Output 無料
Text-to-Speech	VOICEVOX:ずんだもん	1ヶ月あたり 50リクエストまで	3円 / 10,000モーラ
	VOICEVOX:東北ずん子
	VOICEVOX:東北きりたん
	VOICEVOX:東北イタコ
	VOICEVOX:四国めたん
	VOICEVOX:あんこもん
	VOICEVOX:冥鳴ひまり
	VOICEVOX:春日部つむぎ
ドキュメント（RAG）		3円 / 100チャンク

表示価格は税込です。
基盤モデル無償プランと従量課金プランは別プランとなります（自動的に従量課金プランに移行することはありません）。
従量課金プランでも基盤モデル無償プランと同等の無償利用枠が存在します。ドキュメント（RAG）については無償利用枠はなく、両プランとも利用に応じて最小単位（100チャンク）ごとに料金が発生します。
基盤モデル無償プランで無償利用枠を超過した場合、APIリクエストに対してレート制御がかかります。従量課金プランで無償利用枠を超過した場合、各基盤モデルの最小単位（10,000トークン／60秒）ごとに料金が発生します。
基盤モデル無償プランには申し込み数に上限があり、上限に達した場合は新規利用の受付を停止いたします。
モーラとは、かな１字分の音の長さを表す単位です。
VOICEVOX提供モデルに関するライセンス表示および利用条件については、こちらをご確認ください。
その他の提供中モデルについてはサービスサイトをご覧ください。

ご予算に合わせたプランをご提案

ご利用用途・予算に合わせておすすめのプランをご提案いたします

無料で相談する

よくあるご質問

日本の大学の会計ルールに適合する「直接取引」や「請求書払い（後払い：月末締め翌月請求）」は可能ですか？

はい、さくらインターネットでは直接取引および請求書払いに対応しています。
また、お支払いはクレジットカードのほか、法人・文教のお客様にはプリペイド（年度単位）による前払いも利用できます。

年度予算の枠内で使える「事前チャージ（プリペイド）」や「固定料金プラン」の提供はありますか？

はい、「さくらのクラウド」の一部である「高火力 VRT」や「さくらのAI Engine」はご予算に合わせた単年度プリペイドを購入できます。年度を繰り越さないようにできるため、預け金扱いにもなりません。
プリペイドをご利用の場合、残高アラートを設定すれば、残高不足が発生する前に通知できます。

会員登録は個人名目ではなく法人名目で、かつさくらインターネットの営業を通して契約いただく必要があります。

利用状況のモニタリングおよび予算超過を防ぐための利用上限の設定は可能ですか？

はい、コントロールパネルでの課金が伴う起動状況の確認ができます。
また料金アラートの機能を用いた利用金額やプリペイド残額の超過を、メールやSlack、Discordへ通知できます。

補助金や研究期間が終了した後、自費または他の予算でのデータ維持や継続利用はできますか？

はい、補助金などで購入したプリペイド分を超えた物に関しては別途請求されます。
適切な支払い方法を設定いただくことでサービスを継続して利用できます。

具体的なユースケースの見積もりは取れますか？

はい、「料金シミュレーション」を使って試算するだけでなく、そのまま発注に使える見積書も発行できます。
ただし、具体的にどの程度の計算資源がいるのかは、お客様自身で検討いただく必要があります。
ご不明点がございましたら、お気軽にご相談ください。

OS、ドライバ（CUDA/cuDNN）、Python環境（PyTorch/TensorFlow）の初期セットアップや代行支援はありますか？

「さくらのAI Engine」は構築済みのモデルをAPI経由で利用するため初期セットアップは不要です。
ただし、他サービスはお客様側でご準備が必要です。
各種マニュアルをご準備しておりますので、お客様側でご準備・ご対応をお願いいたします。
パートナーによる初期セットアップの支援も可能ですので、別途ご相談ください。

非エンジニアでも利用できるブラウザベースのGUI環境の提供はありますか？

はい、当社ブログ記事「JupyterHubを活用した、いまどきの情報科学の教育環境簡単クラウド構築」などをご参照ください。

Gitのようなバージョン管理機能や、再現性確保のためのコンテナアーカイブ機能は提供していますか？

はい、提供しておりますがVMやデータのバージョン管理はお客様ご自身で行っていただく必要がございます。
VMのディスクについては自動バックアップ機能、コンテナイメージについてはコンテナレジストリー機能をそれぞれ提供しているので、任意の保全が可能です。

調達のリードタイムはどのくらいかかりますか？

コントロールパネル操作やAPIでのリクエスト後、即日ご利用いただけます。

利用期間が決まっている研究（3〜6か月）でも使えますか？

はい、短期間でもサービスをご利用いただけます。研究スケジュールに応じた利用期間でのお見積もりもできます。

推論用途で24時間連続稼働させても問題ありませんか？

「高火力 VRT」は通常のVMと同様に、24時間連続稼働でのご利用を想定しています。ただし、アプリケーションや監視・冗長構成などの本番運用設計はお客様側で行っていただく必要があります。

手元のワークステーションと同じ環境を再現できますか？

はい、ご利用中のフレームワークやライブラリのバージョンに合わせて環境を構成できます。
既存の環境定義（コンテナイメージやスクリプトなど）をお持ちの場合は、そのまま高火力 VRT 上で再現することも可能です。
ただし、利用可能なOSは一部制限がございます。

既存のSaaS・自社クラウドから接続できますか？

はい、「高火力 VRT」上に構築した推論実行環境へ、HTTP/APIなどを用いて接続することができます。
インターネット経由のほか、「さくらのクラウド」のネットワーク機能と組み合わせてVPN等の閉域構成をとることもできます。

「高火力 VRT」リソース上限の緩和はできますか？

はい、初期は1GPUの提供ですが、サポート（support@sakura.ad.jp）に会員ID・プロジェクト名・GPU数・メモリ数・サーバ数などご連絡いただくことで緩和が可能です。詳細はこちらをご確認ください。

秘密情報や知財に関わるようなデータを保護するため、国内リージョンに格納できますか？

弊社サービスでは、国内リージョンに保存され、論理的に隔離されています。

秘密保持契約（NDA）の締結は可能ですか？またハッキング対策などの具体的なセキュリティ基準はどのようになっていますか？

秘密保持契約の締結は可能です。その他セキュリティ対策は当社営業窓口までご相談ください。

ご利用目的・規模感に合わせて最適なGPUプランとおおよその料金イメージをご提案します

まずはお気軽にお問い合わせください

無料で相談する

研究成果に繋がるAI基盤

SPReAD 1000補助金等
各種研究の補助金申請可能

こんな課題はありませんか？

混雑期の計算リソース確保が困難

機密情報管理の課題

研究費運用・会計処理の課題

研究開始までの時間的課題

さくらインターネットのGPU・API基盤で解決！

VM型GPUクラウドサービス

生成AIアプリ開発に最適なAPI基盤

研究用途に合わせてご案内いたします！

様々な研究・業界で活用されるGPU・生成AI

読影支援向け
医用画像の大量推論

シミュレーション・数値解析向け大規模計算

研究データを活用した
カスタムLLM構築

リモートセンシング・
農業向け画像解析

商品情報を学習させた
チャットボットの導入

導入事例

医療AIの社会実装を「高火力DOK」で加速。北海道大学が選んだ信頼と安定感

北海道大学電子科学研究所生体データサイエンス研究分野（藤原幸一研究室）

高火力 VRTでモデル学習を爆速化！仙台高専「WiCON2025」優秀賞の舞台裏に迫る

仙台高等専門学校 Cyfarma

ゲノム情報の高速解析と開発体制の強化

株式会社テンクー

宇宙データとAIを動かす高火力 VRT

株式会社Tellus

研究用途に合わせてご案内いたします！

仕様・料金

高火力 VRT

仕様・スペック

料金

さくらのAI Engine

料金体系

提供モデルと料金

ご予算に合わせたプランをご提案

よくあるご質問

まずはお気軽にお問い合わせください

資料ダウンロード

VM型GPUクラウドサービス高火力 VRT サービス紹介資料

さくらのAI Engine サービス紹介資料

研究成果に繋がるAI基盤

SPReAD 1000補助金等各種研究の補助金申請可能

こんな課題はありませんか？

混雑期の計算リソース確保が困難

機密情報管理の課題

研究費運用・会計処理の課題

研究開始までの時間的課題

さくらインターネットのGPU・API基盤で解決！

VM型GPUクラウドサービス

生成AIアプリ開発に最適なAPI基盤

研究用途に合わせてご案内いたします！

様々な研究・業界で活用されるGPU・生成AI

読影支援向け医用画像の大量推論

シミュレーション・数値解析向け大規模計算

研究データを活用したカスタムLLM構築

リモートセンシング・農業向け画像解析

商品情報を学習させたチャットボットの導入

導入事例

医療AIの社会実装を「高火力DOK」で加速。北海道大学が選んだ信頼と安定感

北海道大学電子科学研究所生体データサイエンス研究分野（藤原幸一研究室）

高火力 VRTでモデル学習を爆速化！仙台高専「WiCON2025」優秀賞の舞台裏に迫る

仙台高等専門学校 Cyfarma

ゲノム情報の高速解析と開発体制の強化

株式会社テンクー

宇宙データとAIを動かす高火力 VRT

株式会社Tellus

研究用途に合わせてご案内いたします！

仕様・料金

高火力 VRT

仕様・スペック

料金

さくらのAI Engine

料金体系

提供モデルと料金

ご予算に合わせたプランをご提案

よくあるご質問

まずはお気軽にお問い合わせください

資料ダウンロード

VM型GPUクラウドサービス 高火力 VRT サービス紹介資料

さくらのAI Engine サービス紹介資料

SPReAD 1000補助金等
各種研究の補助金申請可能

読影支援向け
医用画像の大量推論

研究データを活用した
カスタムLLM構築

リモートセンシング・
農業向け画像解析

商品情報を学習させた
チャットボットの導入

VM型GPUクラウドサービス高火力 VRT サービス紹介資料