GadgetDrop
スマートフォン注目

Google Photosに動画版リミックス「Video remix」か——ワンタップでシネマティック映像化、音声まで自動生成の可能性

GadgetDrop 編集部8
Google Photosに動画版リミックス「Video remix」か——ワンタップでシネマティック映像化、音声まで自動生成の可能性

スマートフォンで撮った何気ない動画が、ワンタップで映画のようなライティングに変わり、背景が差し替わり、雰囲気に合った音声まで自動で付く——そんな未来がGoogle Photosで現実になるかもしれません。Android Authorityが報じたAPK解析によると、コードネーム「Soba」と呼ばれてきた未公開機能は、最終的に「Video remix」という名称で提供される見込みとされています。

なお本記事の内容はアプリの未公開コードを解析した情報に基づくもので、最終的に公開版へ搭載されない可能性や、仕様・名称が変更される可能性があります。

APK解析で浮かび上がった「Video remix」

Android AuthorityのAssembleDebug氏は、Google Photos for Android バージョン7.80.0.929302933のコードを解析し、コードネーム「Soba」の正体が動画版リミックスであることを示すテキスト文字列を発見したと報じています。先月にコラージュ用テンプレートを調査する過程で見つかっていた謎の機能が、ここにきて輪郭を見せた格好です。

Android Authorityも「予測される機能が一般提供に至らない可能性がある」と注記しており、本稿の内容も変更されうる前提でお読みください。

ワンタップでシネマティック映像化、音声まで自動生成の可能性

解析されたコード内の文言を整理すると、「Video remix」は次のような体験を狙っていると読めます。

  • シネマティックなリライティング(cinematic relighting)——スマホで撮った動画が、まるで映画のワンシーンのような光の演出に変わる可能性
  • 没入感のある背景の差し替え(immersive background swaps)——撮影した場所とは異なる雰囲気の背景に置き換えられる可能性
  • 動画のスタイル変換(beautiful stylization)——アニメ調・絵画調など、別の映像表現への変換が想定される
  • これらをすべて「ワンタップ」で適用
  • 音声も生成される可能性(Sounds may also be generated)——映像に合うBGMや効果音まで自動付与される可能性

紹介テキストには「Get cinematic relighting, immersive background swaps, and beautiful stylization for your video in one tap.」との表記が含まれており、2025年に提供が始まった写真向けの「Photo remix」や「Photo to video」の系譜に連なる機能になると見込まれています。旅行で撮った手ブレ気味のクリップが、ワンタップで「ちょっとした映画予告編」のように仕上がる——そんな使い方が想像できる内容です。

クラウド処理が前提、無料枠は日次上限の可能性

写真向けリミックスと同様、処理はクラウド側で行われるため、対象の動画をGoogleにバックアップしておく必要があります。コードには「Back up this video to generate a video」というメッセージや、無料枠と「Google AIサブスクリプション」加入による上限緩和への言及もあり、無料ユーザーには日次の生成上限が設けられる可能性があります。

入力動画にも条件が想定されています。コードからは、以下のような注意書きが読み取れます。

  • 短すぎる動画は対象外(invalid_duration_too_short)
  • 手ブレの少ない安定した映像が望ましい(Keep it steady)
  • 被写体は1〜2つに絞る方が良好な結果が得られる(Simplify the shot)
  • 室内クリップには室内向けエフェクトを合わせるなど、雰囲気を揃える(Match the vibe)
  • 生成結果は毎回異なるため、テンプレートを試行する(Experiment)

バックエンドのモデルはVeoか、Gemini Omniか

どの動画生成モデルが裏側で使われるのかは、現時点では明らかにされていません。Android Authorityは候補としてVeoを挙げつつ、新たに登場した「Gemini Omni」も適合し得ると指摘しています。実際のUIや動作はまだ確認できておらず、コード上のボタンに「Video remix」のラベルが現れている段階にとどまります。

リーク段階の情報であるため、現時点では「Google Photosに動画リミックスが来る可能性が高まった」と判断するのが妥当でしょう。一般提供時期や対応地域、無料枠の具体的な本数などは公表されていません。写真向けの「Photo remix」がコード上の痕跡発見から比較的早く正式機能として展開された経緯を踏まえると、今後数か月のうちに実機での出現報告や公式アナウンスが出てくる可能性があります。Google Photosをよく使う方は、アプリのアップデートと「Create」タブの新規ボタン追加に注目しておくと、いち早く変化に気づけるはずです。

写真版「Photo to video」も2026年1月に大型強化、カスタムプロンプトと音声デフォルト化へ

動画版リミックスに先行する写真版「Photo to video」は、2026年1月27日のアップデートで体験が大きく拡張されています。

  • 自由文プロンプト対応: 従来は「Subtle movement」「I'm feeling lucky」の2プリセットのみでしたが、ユーザー自身が動き・スタイル・効果を文章で指示できるようになっています
  • プロンプトサジェスト: 入力欄には「instant video inspiration」と呼ばれる候補文言が提示され、生成後の編集・再調整も可能とされています
  • 音声のデフォルト付与: カスタムプロンプト経由でもプリセット経由でも、生成動画には既定で音声が付くようになっています
  • 年齢制限: テキストプロンプト機能は18歳以上のユーザーに限定されています

SNS向けに追加編集なしでそのまま投稿しやすい仕上がりを狙った設計で、Video remixで示唆されている「音声まで自動生成」の方向性とも整合します。Photo to videoでの音声デフォルト化が先に実装された流れを踏まえると、Video remixの音声生成も同水準のデフォルト体験として実装される可能性が読み取れます。

バックエンド候補「Gemini Omni」と「Veo 3.1」、それぞれの得意領域

Video remixを支え得る動画生成モデルとして、2026年に登場した2系統の最新世代が候補に挙がっています。

モデル公開時期主な特性出力上限
Gemini Omni FlashGoogle I/O 2026(5月19日)画像・音声・動画・テキストの任意組み合わせ入力、多ターン会話編集、物理シミュレーション統合1ターン約10秒
Veo 3.12026年4月シネマティック画質、extendによる長尺ワークフロー最大4K

Omni Flashは発表当日からGeminiアプリ、Google Flow、YouTube Shortsへ同時展開されており、Google DeepMindが「統合マルチモーダル生成モデル」と位置付けています。一方Veo 3.1は解像度と長尺生成で優位とされ、両者は競合というより役割分担に近い構図です。Video remixが要求する「ワンタップでの背景差し替え・リライティング・スタイル変換・音声生成」を1パスでこなすには、マルチモーダル入力と短尺生成に特化したOmni Flashの設計が親和的との見方も成り立ちますが、Googleは現時点で採用モデルを明らかにしていません。

Q&A

Q. 既存の「Photo remix」とは何が違うのですか? Photo remixが静止画を対象にスタイル変換などを行うのに対し、今回示唆された「Video remix」は動画そのものを入力として、ライティング・背景・スタイルをワンタップで変換し、さらに音声まで生成される可能性があるとされています。写真版で培ったリミックス体験を動画に拡張する位置づけと読めます。

Q. iPhone(iOS版Google Photos)でも使えますか? 今回のAPK解析はGoogle Photos for Android バージョン7.80.0.929302933を対象としたものであり、iOS版での提供可否やタイミングについては、現時点では明らかにされていません。

Q. 無料で使えますか? コード内の文言からは、無料の日次生成枠が用意される一方、「Google AIサブスクリプション」に加入することで上限を引き上げられる可能性があります。具体的な本数は公表されていません。

Q. 動画はオフラインでも処理されますか? いいえ、写真向けのリミックスと同様、処理はクラウド側で行われるため、対象動画をGoogle Photosにバックアップしておく必要があると報じられています。

出典

ポストLINEで送るはてブ
GD

GadgetDrop 編集部

スマホ・PC・AI・XRなど幅広いテクノロジーを、スペックの行間まで読む視点で解説します。速報から深掘り分析まで、テック選びと業界理解に役立つ情報をお届けしています。