「動画を作りたいけど、編集ソフトを開くところで止まる…」ってありますよね。そんなときに頼れるのが、文章から動画を作る“動画生成AI(テキストや画像の指示で動画を作るAI)”。
今回はGoogleが発表した Veo 3.1 Lite(コスト重視の動画生成モデル)をきっかけに、今日から試せる作り方の型をまとめます。ツールの細かい比較より、「どう指示すると失敗しにくいか」に寄せます。
目次
Veo 3.1 Liteって何?できることを1分で
ニュースとしては、Googleが Veo 3.1 Lite を「よりコスト効率よく使える動画生成モデル」として紹介しています(開発者向けに“Build with”と書いてあるので、APIや開発環境で使う想定も強めです)。
- 文章(プロンプト)から短い動画を生成できる
- 高品質路線だけでなく、費用を抑えて回せる選択肢が増える
- 試作(ラフ)を量産して、当たりを拾う運用と相性がいい
ここで大事なのは「すごいモデルが出た」よりも、動画生成を“1発勝負”から“試作前提”に変えやすいこと。私はこのタイプの進化、地味に助かります。動画は一発で当てるのが一番つらいので…。
こんな人におすすめ
- SNS用に、短い告知動画やループ動画を作りたい
- 商品・サービスの紹介を、画像だけじゃなく動画でも出したい
- 編集スキルより先に、まず「それっぽい叩き台」が欲しい
- 動画生成AIに興味はあるけど、コストが読めなくて止まっている
無料で使える?料金は?(2026年3月時点の考え方)
Veo 3.1 Liteは「最もコスト効率が良いモデル」として紹介されていますが、この記事では“確定の価格”は断言しません(プランや提供形態で変わりやすいからです)。
ただ、考え方としてはこうです。
- 無料枠がある場合:まずは無料枠で「プロンプトの型」だけ身につける
- 従量課金の場合:Liteでラフを量産 → 当たりだけ高品質設定で作り直す
- チームで触るなら「誰が・何を・何回生成したか」を軽くメモして、課金の体感を早めに掴む
要は、いきなり“本番動画を作る”より、30分で10本試作みたいな触り方が安全です。
使い方の全体像:動画は「3枚の紙」に分解するとラク
動画生成AIは、長文で気合いを入れるほど外すことがあります。私がうまくいきやすいのは、まず指示を3つに分けるやり方です。
- ①目的:何のための動画?(例:新サービスの告知、採用、イベント集客)
- ②見た目:映像の雰囲気(例:実写風、アニメ風、ミニマル、暗め)
- ③カメラと動き:何がどう動く?(例:ゆっくりズーム、パン、ループ)
この3点が揃うと、モデルが変わっても応用が効きます。
今日からの手順:Veo系で「外さない」動画を作る5ステップ
ステップ1:先に「尺」と「用途」を決める
最初にここを決めるだけで、失敗が減ります。
- SNSの短尺:6〜10秒を基本に(ループさせやすい)
- 広告っぽい告知:10〜15秒でメッセージ1個に絞る
- 説明動画:動画生成だけで完結させず、字幕と静止画も混ぜる前提で
ステップ2:ChatGPT(またはGemini/Claude)で「プロンプトの原案」を作る
いきなり動画モデルに投げないで、まず文章AIに“設計図”を書かせるのがコツです。ここで「映像として破綻しない指示」に整えます。
あなたは動画CMの演出家です。
目的:{目的}
尺:{秒数}
ターゲット:{誰向け}
入れたい情報:{箇条書き}
NG:文字だらけ、激しい点滅、不自然な手指
出力:
1) シーンを3〜5カットに分けた絵コンテ(文章でOK)
2) 各カットの「映像の見た目」「カメラの動き」「被写体の動き」
3) 動画生成AIに貼る短い英語プロンプト(各カット1つ)
4) 失敗しやすい点と回避策
ここで英語プロンプトにしているのは、動画系は英語のほうが表現が安定しやすいことが多いからです(もちろん日本語で試してOK)。
ステップ3:Veo 3.1 Liteでまず“ラフ”を複数本作る
Liteの強みは、たぶんここです。1本だけ作って悩むより、同じ狙いで3〜5本作って「当たりの方向」を見つけます。
- 同じプロンプトで複数回(ランダム性の違いで当たりが出る)
- 背景だけ変える版、カメラだけ変える版を作る
- 人物が崩れるなら、最初は人物を出さない(物撮り・タイポなし)も手
ステップ4:当たりが出たら「固定したい条件」を増やす
動画生成は“自由度”が高いほど暴れます。良い1本が出たら、次は自由度を下げます。
- 色:例「monochrome」「pastel blue and white」
- ライティング(照明):例「soft studio lighting」
- レンズ感:例「35mm film look」「shallow depth of field(被写界深度が浅い)」
- 動き:例「slow dolly-in」「steady camera」
ステップ5:仕上げは「字幕」と「音」で勝つ
正直、動画生成の“映像だけ”で完璧を狙うと沼です。最後は編集で勝つのが早いです。
- 字幕は短く(1カット1メッセージ)
- 音はフリー素材でもいいので、テンポを合わせる
- ロゴやCTA(行動喚起:例「詳細はこちら」)は別レイヤーで載せる
コピペで使える:用途別プロンプト例(短尺向け)
1) サービス告知(抽象表現で崩れにくい)
Minimal abstract animation, clean white background, soft gradient light, smooth flowing shapes forming a simple icon, slow dolly-in, calm and premium mood, 8 seconds, seamless loop, no text, no people
2) 物撮り風(ECやレビューの雰囲気に寄せる)
Studio product shot of a small gadget on a matte desk, softbox lighting, realistic shadows, slow pan left, shallow depth of field, cinematic, 10 seconds, no hands, no text, clean background
3) アプリ紹介(画面は見せず“体験”で見せる)
Modern office scene, close-up of a notebook and coffee, subtle motion of sunlight and curtain, calm productivity vibe, steady camera, 7 seconds, realistic, no screen content, no text
うまくいかない時の「よくある詰まり」と直し方
- 情報を詰め込みすぎ:登場物を2つまでに減らす(背景、被写体)
- 手や顔が崩れる:人物なしで成立する映像にする、手元カットを避ける
- 動きが不自然:「steady」「slow」「smooth」を入れて、激しい動詞を減らす
- 雰囲気がバラつく:色、照明、レンズ感の3点を固定する
まとめ:まずは「8秒ループ」を3本作ってみよう
Veo 3.1 Liteみたいな“回しやすい”動画生成が出てくると、動画づくりのコツは「才能」より試作の回数と、指示の型になります。
最初の一歩はこれで十分です。
- 8秒のループ動画を狙う
- ChatGPT/Gemini/Claudeで絵コンテ化してから投げる
- 同じ狙いで3本作って、当たりの条件を固定していく
「編集はあとでいいから、まず1本それっぽいのが欲しい」って人ほど、効きます。今日の作業の最後に、試しに1本だけ作ってみてください。
参考リンク
- Build with Veo 3.1 Lite, our most cost-effective video generation model(Google AI Blog)
- AI Has Flooded All the Weather Apps(Wired AI)
- Alexa+ gets new food ordering experiences with Uber Eats and Grubhub(TechCrunch AI)
Photo by Solen Feyissa on Unsplash

