aivideospeed

平台操作 SOP

AI 圖片與影片生成平台 功能操作手冊
aivideospeed.com/dashboard
適用對象客戶(電商/品牌行銷/自媒體經營者)與教學人員
版本v1.1(草稿,截圖已遮蔽機密提示詞)
建立日期2026-06-05
說明:本手冊每個功能獨立成卡片,可用下方「我想做…」對照表或「功能索引」快速找到所需功能。截圖中的提示詞、生成指令與帳務數字為商業機密,已做遮蔽處理。實際介面與點數費率以平台最新版本為準。

🏠 平台概覽

aivideospeed 是整合多家 AI 引擎的「圖片與影片自動生成平台」,主要服務電商、品牌行銷與自媒體經營者。左側主選單分為:圖片專案、影片專案、創作流工作室、Claude 動畫工作室、視覺庫、API 設定、教學中心。

AI 引擎用途
kie.ai(GPT Image-2)主要圖片生成模型:UGC 人物、場景、帶貨、分鏡圖
fal.ai人物產品多角度、影片升畫質(upscale 至 1080p);部分功能需自設 key
Anthropic Claude提示詞/分鏡腳本的文字生成與改寫
KLING 3.0(可靈)無限網紅分身影片;自動生成符合人臉的聲音
C-DANCE 2.0 Fast分鏡影片生成,支援參考影片、參考音訊與長影片接續
平台儀表板:左側主選單,上方顯示各 AI 引擎額度與使用統計
平台儀表板:左側主選單,上方顯示各 AI 引擎額度與使用統計 (提示詞/機密數字已遮蔽)

🔎 我想做…(依需求找功能)

我想要…建議使用的功能
我要一個專屬虛擬代言人/網紅臉UGC 虛擬人物
讓人物出現在我的店面/場景UGC 場景
人物手拿商品的真實帶貨照/片UGC 帶貨/UGC 帶貨(影片版)
做專業廣告短片(15 秒)廣告影片創作大師
做 60 秒以上的長影片延伸長影片(接續)/無限網紅分身
虛擬主播講知識/Podcast無限網紅分身
卡通/旁白說書影片知識影片導演
大量電商商品圖/整套上架圖快速產品圖/大量改圖小幫手
商品或 model 多角度展示人物產品多角度

🧭 功能索引(點擊跳到該功能)

📘 操作前必讀:符號與參考標記

符號/標記意義
@image1 / @1第一張參考素材,通常代表「人物」
@image2 / @2第二張參考素材,通常代表「場景」或「商品」
@image3 / @3第三張參考素材,例如分鏡版
@one / @two / @threeUGC 虛擬人物中,三張要融合的人物參考照
@VDO1(VDO1)參考影片標記,用於長影片接續
Audio1 / Audio2參考音訊標記,指定不同角色配音

為什麼提示詞常用英文 / image1、image2?

AI 制圖模型主要以英文訓練,對英文提示詞理解度較高。

填提示詞時建議把 @1、@2 改寫為 image1、image2,再描述場景/動作,辨識更準。

🗂 功能詳解

A. 圖片專案(UGC 四式)

圖片專案

UGC 虛擬人物

用途用三張人物照融合出一個全新、不存在於現實的高擬真虛擬人物。

適合情境想要一個專屬、可長期重複使用的虛擬代言人或網紅臉孔。

圖片專案的「編輯 Prompt」視窗:上方四個分頁=UGC 虛擬人物/場景/帶貨/三視圖;可選模型 GPT Image-2 與比例 9:16
圖片專案的「編輯 Prompt」視窗:上方四個分頁=UGC 虛擬人物/場景/帶貨/三視圖;可選模型 GPT Image-2 與比例 9:16 (提示詞/機密數字已遮蔽)

操作步驟

  1. 進入「圖片專案 → 品牌企劃 → +新增任務」,點任務框開啟「編輯 Prompt」。
  2. 選「UGC 虛擬人物」分頁;生成平台 kie.ai、模型 GPT Image-2、比例建議 9:16。
  3. 於 @one、@two、@three 各上傳一張人物照(性別需一致)。
  4. 如需特定特徵,於提示詞補充(例:自然捲髮)。
  5. 儲存並生成;系統會擷取三人特徵合成全新人物。

操作要點

三張照片性別必須一致(男配男、女配女)。

此人物可作為後續所有影片功能的主角。

圖片專案

UGC 場景

用途把虛擬人物(image1)放進你指定的場景(image2)。

適合情境想讓人物出現在特定背景,例如你的店面、工廠、櫃位。

操作步驟

  1. 在「編輯 Prompt」選「UGC 場景」分頁。
  2. image1 = 人物;image2 = 場景,上傳你要的場景圖。
  3. 把提示詞中的 @1、@2 改寫為 image1、image2,其餘維持預設。
  4. 儲存並生成。
圖片專案

UGC 帶貨

用途把人物轉成「手機隨拍感」的擬真畫面,並讓人物手持你的商品。

適合情境要做像真人拍攝的開箱/帶貨照,效果極度擬真。

操作步驟

  1. 在「編輯 Prompt」選「UGC 帶貨」分頁。
  2. image1 = 人物;image2 = 商品。
  3. 於提示詞指定商品擺放位置(手中/桌面/其他合理位置)。
  4. 儲存並生成。
圖片專案

UGC 三視圖

用途生成人物的正面、側面、背面三視圖,並附人臉正面特寫(含髮型)。

適合情境製作影片前的必要前置——讓影片中人物的姿勢與動作保持一致。

操作步驟

  1. 在「編輯 Prompt」選「UGC 三視圖」分頁。
  2. 上傳人物的正面、全身與側面照,讓 AI 充分理解人物樣貌。
  3. 生成後即得三視圖,可作為「廣告影片創作大師」的角色圖素材。

為什麼重要

三視圖是廣告影片創作大師的必備素材,建議做影片前先把它做好。

B. 影片專案

影片專案

分鏡影片(基本)

用途以分鏡圖為基礎,由 C-DANCE 2.0 讀懂每一格畫面後生成影片。

適合情境已經有分鏡圖,想快速轉成影片。

影片專案介面:左側設定比例/時長/解析度,中間為各分鏡的提示詞與生成預覽,可逐格「再生成」
影片專案介面:左側設定比例/時長/解析度,中間為各分鏡的提示詞與生成預覽,可逐格「再生成」 (提示詞/機密數字已遮蔽)

操作步驟

  1. 進入「影片專案」,設定模型 C-DANCE 2.0 Fast、比例、解析度。
  2. 上傳分鏡圖。
  3. 提示詞填:「讓 image2 跟著 image1 的分鏡腳本內容與運鏡方式,轉換成影片」。
  4. 生成,可逐格「再生成」微調。
設定項目建議值
生成模型C-DANCE 2.0 Fast
畫面比例16:9(橫)或 9:16(直)
單段時長最長 15 秒
解析度480p/720p(1080p 約 700 點,太貴,不建議直接出)
分鏡圖解析度建議 4K

提示詞公式

讓 image2 跟著 image1 的分鏡腳本內容與運鏡方式,轉換成影片。

影片專案

延伸長影片(60 秒接續)

用途用「首尾接續」把多段 15 秒影片串成 60 秒以上的連貫影片。

適合情境需要 60 秒以上、人物與場景前後一致的長影片。

操作步驟

  1. 把腳本切成 4 段(1–15/16–30/31–45/46–60 秒),各做一張分鏡圖。
  2. 用第 1 張分鏡圖生成第一段 15 秒,完成後下載存檔。
  3. 上傳剛下載的影片(標記 VDO1)+第 2 張分鏡圖。
  4. 提示詞:「延續 VDO1,讓 VDO1 跟著 image1(第 2 張分鏡圖)延續下來的影片」。
  5. 系統從前一段最後一幀接續,產出第二段;依此類推完成 4 段後合併。

重點

60 秒 = 4 張分鏡圖 + 3~4 段接續影片。

用 C-DANCE 2.0,因為它支援上傳參考影片接續。

影片專案

參考影片(動畫模仿)

用途上傳一支動畫影片當參考,讓真人/虛擬人物模仿其動作。

適合情境搞怪/動畫類創作,例如讓兩個真人模仿動畫角色的對打動作。

操作步驟

  1. 上傳要模仿的參考影片。
  2. 提示詞指定對應關係(例:image1 男生模仿參考影片左邊男生、女生模仿右邊女生)。
  3. 生成,轉成真人後動作會與參考一致。
影片專案

參考音訊

用途上傳配音,指定影片中不同角色使用的聲音。

適合情境要讓影片中的角色用指定的聲音講台詞。

操作步驟

  1. 錄製約 10 秒的聲音,最多可上傳 3 段。
  2. 於提示詞指定角色配音(例:男生用 Audio1、女生用 Audio2)。
  3. 生成,系統以對應聲音講出台詞。

C. 創作流工作室

創作流工作室

無限網紅分身(虛擬主播 / Podcast)

用途上傳虛擬人物+輸入講稿,由 KLING 3.0 生成虛擬主播影片,並以首尾幀串接成任意長度。

適合情境要做知識型 Podcast、虛擬主播、長口播影片。

無限網紅分身:左側設定秒數與畫質(KLING 3.0:Std/Pro/4K),中間為依字幕自動切分的各段,逐段以「首尾針」銜接
無限網紅分身:左側設定秒數與畫質(KLING 3.0:Std/Pro/4K),中間為依字幕自動切分的各段,逐段以「首尾針」銜接 (提示詞/機密數字已遮蔽)

操作步驟

  1. 上傳虛擬人物(專業知識型可用 16:9,桌上能擺商品)。
  2. 左側貼上「要講的內容」逐字稿(可先用 GPT 生成口播稿)。
  3. 選每段秒數(建議 5 秒:快、失敗率最低)與畫質(先 Std 測試,OK 再轉 Pro≈720p)。
  4. 系統依文字長度自動切段並逐段生成。
  5. 可於「動作提示詞」微調表情動作;不要鏡頭推拉就加固定鏡頭指令。
  6. 每段完成點「首尾針」擷取尾幀作下一段首幀;最後下載合併、上字幕。

優點

文字越長段數越多——2000~3000 字可做 10 分鐘以上。

KLING 3.0 會自動生成符合該人臉的聲音,換場景/髮型聲音仍一致。

創作流工作室

知識影片導演 / 劇場(旁白說書)

用途卡通/虛擬人物知識影片,搭配「說書式旁白」念稿(非人物本人講話)。

適合情境經營卡通頻道、Q 版人物說明、知識說書型影片。

操作步驟

  1. 建立/指定虛擬人物(畫風決定成品風格)。
  2. 於「聲音參考」錄一段聲音轉成 TTS 旁白;或選不生成語音、只生影片。
  3. 輸入主題,系統發想完整旁白文案,可再修改。
  4. 按「確認切分」切成所需格數。
  5. 生成所有影片;注意音畫同步(例:把 5 秒畫面縮成 4 秒對齊旁白)。
創作流工作室

UGC 帶貨(影片版)

用途由人物照+商品快速生成帶貨影片,自動產生台詞。

適合情境要快速產出真人感的商品帶貨短片。

操作步驟

  1. 上傳人物與商品,按「直視」生成帶貨圖。
  2. 選影片引擎:可靈 3.0 或 C-DANCE 2.0。
  3. 生成腳本並產生音訊;系統分析圖片自動產生台詞(可中/英文)。
  4. 進階:下載成品丟回影片專案接續,延伸出不同台詞的第二段。
創作流工作室

廣告影片創作大師(招牌功能)

用途業界標準工作流:角色三視圖+產品圖+分鏡版 → 生成分鏡腳本 → 15 秒廣告片。

適合情境要做專業廣告短片,場景控制與人物一致性最高。

廣告影片創作大師:左側設定故事地點/風格/情緒/分鏡數量(9格)/比例;右側產出電影分鏡腳本與角色六視圖(成品展示)
廣告影片創作大師:左側設定故事地點/風格/情緒/分鏡數量(9格)/比例;右側產出電影分鏡腳本與角色六視圖(成品展示) (提示詞/機密數字已遮蔽)

操作步驟

  1. 先用「UGC 三視圖」做角色圖;準備產品參考圖(建議白底)。
  2. 設定故事地點、廣告風格、情緒氛圍;分鏡數量建議 9 格、比例 16:9、平台 KIE.ai。
  3. 按「生成故事腳本」產出結構化分鏡腳本(鏡頭 1~9)。
  4. 確認後按「確認・生成分鏡板」,產出近 2K~4K 分鏡圖。
  5. 影片提示詞:「讓 image1 與 image2 跟著 image3 的分鏡腳本」(角色圖/產品圖/分鏡版)。
  6. 用 C-DANCE 2.0 生成 15 秒廣告片。
  7. 升畫質:先出 720p,再用 fal.ai upscale 升 1080p(每秒幾美分,比直接出便宜)。

延伸用法

要超過 60 秒:請 GPT/Claude 改各鏡頭動作,再依「延伸長影片」接續。

D. 圖片智能功能

圖片智能

大量改圖小幫手

用途批量上傳圖片,套用同一段提示詞一次改完並批量下載。

適合情境賣場需要大量、風格一致地出圖。

大量改圖小幫手:批量上傳 → 設定提示詞與浮水印 → 批量生成 → 批量下載(成品展示)
大量改圖小幫手:批量上傳 → 設定提示詞與浮水印 → 批量生成 → 批量下載(成品展示) (提示詞/機密數字已遮蔽)

操作步驟

  1. 點擊或拖曳上傳多張圖片(支援 JPG/PNG/WEBP)。
  2. 輸入要套用的提示詞;需要的話開啟浮水印並設定位置/大小/透明度。
  3. 按「開始批量生成」,完成後一鍵批量下載。
圖片智能

人物產品多角度(需 fal.ai key)

用途生成同一人物/產品的不同角度,可控制垂直與左右角度。

適合情境服裝、時尚廣告需要多角度 model;產品要多視角展示。

操作步驟

  1. 於「API 設定」填入 fal.ai key。
  2. 上傳人物/產品,調整垂直與左右角度參數。
  3. 生成所需的各個角度圖。
圖片智能

快速產品圖(電商九宮格)

用途輸入商品資訊,自動生成電商(如蝦皮)九宮格產品圖與文案,可多風格套組。

適合情境電商上架要快速產出整套商品圖與文案。

快速產品圖:填商品名稱/品類/核心賣點/目標客群並上傳產品圖,系統產出 9 張套圖與文案
快速產品圖:填商品名稱/品類/核心賣點/目標客群並上傳產品圖,系統產出 9 張套圖與文案 (提示詞/機密數字已遮蔽)

操作步驟

  1. 填寫商品資訊:商品名稱、品類類型、核心賣點、目標客群。
  2. 上傳產品參考圖(實體商品);服務類(醫美/SPA)則上傳人物或診所名稱。
  3. 選擇產品類型,系統自動生成對應的 prompt 與文案。
  4. 確認文案後生成 9 張圖(p1~p9)。
  5. 需多風格時,於右側「新增套組」再生成另一組同文案、不同風格的圖。

💰 點數與成本

項目成本概念
C-DANCE 1080p 直接生成約 700 點/次,最貴,不建議
15 秒影片生成約 270 點(偏高,使用前先評估)
fal.ai 影片升畫質(upscale)每秒約幾美分,最省,建議先低解析度再升 1080p
畫質 Stand vs Pro先用 Stand 測試 → 確認後轉 Pro(Pro ≈ 720p,較便宜)
可靈 3.0一步約 70~80 點,較便宜,且自動生成符合人臉的聲音

省錢三原則

1. 先低後高:先用 480p/Stand 測試,OK 再升解析度。

2. 升畫質走 fal.ai upscale,不要直接用 C-DANCE 出 1080p。

3. 長影片用 5 秒分段接續,失敗率最低、最省重做成本。

❓ 常見問題(FAQ)

Q:要做 60 秒以上的影片?

A:把腳本切成多張分鏡圖,用「延伸長影片(VDO1 接續)」逐段串接。

Q:人物在不同鏡頭長得不一樣?

A:務必先用「UGC 三視圖」做角色圖,才能維持人物與姿勢一致。

Q:提示詞要中文還英文?

A:建議把 @1、@2 改寫成 image1、image2,並用英文描述場景/動作。

Q:想要 1080p 但太貴?

A:先出 720p,再用 fal.ai upscale 升 1080p,每秒僅幾美分。

Q:虛擬主播聲音可以換嗎?

A:KLING 3.0 以該人臉生成後聲音即固定;需不同聲音請改用其他工作流或參考音訊。

Q:分鏡圖解析度設多少?

A:建議 4K。