aivideospeed 平台操作 SOP

說明：本手冊每個功能獨立成卡片，可用下方「我想做…」對照表或「功能索引」快速找到所需功能。截圖中的提示詞、生成指令與帳務數字為商業機密，已做遮蔽處理。實際介面與點數費率以平台最新版本為準。

🏠 平台概覽

aivideospeed 是整合多家 AI 引擎的「圖片與影片自動生成平台」，主要服務電商、品牌行銷與自媒體經營者。左側主選單分為：圖片專案、影片專案、創作流工作室、Claude 動畫工作室、視覺庫、API 設定、教學中心。

AI 引擎	用途
kie.ai（GPT Image-2）	主要圖片生成模型：UGC 人物、場景、帶貨、分鏡圖
fal.ai	人物產品多角度、影片升畫質（upscale 至 1080p）；部分功能需自設 key
Anthropic Claude	提示詞／分鏡腳本的文字生成與改寫
KLING 3.0（可靈）	無限網紅分身影片；自動生成符合人臉的聲音
C-DANCE 2.0 Fast	分鏡影片生成，支援參考影片、參考音訊與長影片接續

平台儀表板：左側主選單，上方顯示各 AI 引擎額度與使用統計　（提示詞／機密數字已遮蔽）

🔎 我想做…（依需求找功能）

我想要…	建議使用的功能
我要一個專屬虛擬代言人／網紅臉	UGC 虛擬人物
讓人物出現在我的店面／場景	UGC 場景
人物手拿商品的真實帶貨照／片	UGC 帶貨／UGC 帶貨（影片版）
做專業廣告短片（15 秒）	廣告影片創作大師
做 60 秒以上的長影片	延伸長影片（接續）／無限網紅分身
虛擬主播講知識／Podcast	無限網紅分身
卡通／旁白說書影片	知識影片導演
大量電商商品圖／整套上架圖	快速產品圖／大量改圖小幫手
商品或 model 多角度展示	人物產品多角度

🧭 功能索引（點擊跳到該功能）

圖片專案

UGC 虛擬人物 UGC 場景 UGC 帶貨 UGC 三視圖

影片專案

分鏡影片（基本）延伸長影片（60 秒接續）參考影片（動畫模仿）參考音訊

創作流工作室

無限網紅分身（虛擬主播 / Podcast）知識影片導演 / 劇場（旁白說書）UGC 帶貨（影片版）廣告影片創作大師（招牌功能）

圖片智能

大量改圖小幫手人物產品多角度（需 fal.ai key）快速產品圖（電商九宮格）

📘 操作前必讀：符號與參考標記

符號／標記	意義
@image1 / @1	第一張參考素材，通常代表「人物」
@image2 / @2	第二張參考素材，通常代表「場景」或「商品」
@image3 / @3	第三張參考素材，例如分鏡版
@one / @two / @three	UGC 虛擬人物中，三張要融合的人物參考照
@VDO1（VDO1）	參考影片標記，用於長影片接續
Audio1 / Audio2	參考音訊標記，指定不同角色配音

為什麼提示詞常用英文 / image1、image2？

AI 制圖模型主要以英文訓練，對英文提示詞理解度較高。

填提示詞時建議把 @1、@2 改寫為 image1、image2，再描述場景／動作，辨識更準。

🗂 功能詳解

A. 圖片專案（UGC 四式）

圖片專案

UGC 虛擬人物

用途用三張人物照融合出一個全新、不存在於現實的高擬真虛擬人物。

適合情境想要一個專屬、可長期重複使用的虛擬代言人或網紅臉孔。

圖片專案的「編輯 Prompt」視窗：上方四個分頁＝UGC 虛擬人物／場景／帶貨／三視圖；可選模型 GPT Image-2 與比例 9:16　（提示詞／機密數字已遮蔽）

操作步驟

進入「圖片專案 → 品牌企劃 → ＋新增任務」，點任務框開啟「編輯 Prompt」。
選「UGC 虛擬人物」分頁；生成平台 kie.ai、模型 GPT Image-2、比例建議 9:16。
於 @one、@two、@three 各上傳一張人物照（性別需一致）。
如需特定特徵，於提示詞補充（例：自然捲髮）。
儲存並生成；系統會擷取三人特徵合成全新人物。

操作要點

三張照片性別必須一致（男配男、女配女）。

此人物可作為後續所有影片功能的主角。

圖片專案

UGC 場景

用途把虛擬人物（image1）放進你指定的場景（image2）。

適合情境想讓人物出現在特定背景，例如你的店面、工廠、櫃位。

操作步驟

在「編輯 Prompt」選「UGC 場景」分頁。
image1 = 人物；image2 = 場景，上傳你要的場景圖。
把提示詞中的 @1、@2 改寫為 image1、image2，其餘維持預設。
儲存並生成。

圖片專案

UGC 帶貨

用途把人物轉成「手機隨拍感」的擬真畫面，並讓人物手持你的商品。

適合情境要做像真人拍攝的開箱／帶貨照，效果極度擬真。

操作步驟

在「編輯 Prompt」選「UGC 帶貨」分頁。
image1 = 人物；image2 = 商品。
於提示詞指定商品擺放位置（手中／桌面／其他合理位置）。
儲存並生成。

圖片專案

UGC 三視圖

用途生成人物的正面、側面、背面三視圖，並附人臉正面特寫（含髮型）。

適合情境製作影片前的必要前置——讓影片中人物的姿勢與動作保持一致。

操作步驟

在「編輯 Prompt」選「UGC 三視圖」分頁。
上傳人物的正面、全身與側面照，讓 AI 充分理解人物樣貌。
生成後即得三視圖，可作為「廣告影片創作大師」的角色圖素材。

為什麼重要

三視圖是廣告影片創作大師的必備素材，建議做影片前先把它做好。

B. 影片專案

影片專案

分鏡影片（基本）

用途以分鏡圖為基礎，由 C-DANCE 2.0 讀懂每一格畫面後生成影片。

適合情境已經有分鏡圖，想快速轉成影片。

影片專案介面：左側設定比例／時長／解析度，中間為各分鏡的提示詞與生成預覽，可逐格「再生成」　（提示詞／機密數字已遮蔽）

操作步驟

進入「影片專案」，設定模型 C-DANCE 2.0 Fast、比例、解析度。
上傳分鏡圖。
提示詞填：「讓 image2 跟著 image1 的分鏡腳本內容與運鏡方式，轉換成影片」。
生成，可逐格「再生成」微調。

設定項目	建議值
生成模型	C-DANCE 2.0 Fast
畫面比例	16:9（橫）或 9:16（直）
單段時長	最長 15 秒
解析度	480p／720p（1080p 約 700 點，太貴，不建議直接出）
分鏡圖解析度	建議 4K

提示詞公式

讓 image2 跟著 image1 的分鏡腳本內容與運鏡方式，轉換成影片。

影片專案

延伸長影片（60 秒接續）

用途用「首尾接續」把多段 15 秒影片串成 60 秒以上的連貫影片。

適合情境需要 60 秒以上、人物與場景前後一致的長影片。

操作步驟

把腳本切成 4 段（1–15／16–30／31–45／46–60 秒），各做一張分鏡圖。
用第 1 張分鏡圖生成第一段 15 秒，完成後下載存檔。
上傳剛下載的影片（標記 VDO1）＋第 2 張分鏡圖。
提示詞：「延續 VDO1，讓 VDO1 跟著 image1（第 2 張分鏡圖）延續下來的影片」。
系統從前一段最後一幀接續，產出第二段；依此類推完成 4 段後合併。

重點

60 秒 = 4 張分鏡圖 + 3～4 段接續影片。

用 C-DANCE 2.0，因為它支援上傳參考影片接續。

影片專案

參考影片（動畫模仿）

用途上傳一支動畫影片當參考，讓真人／虛擬人物模仿其動作。

適合情境搞怪／動畫類創作，例如讓兩個真人模仿動畫角色的對打動作。

操作步驟

上傳要模仿的參考影片。
提示詞指定對應關係（例：image1 男生模仿參考影片左邊男生、女生模仿右邊女生）。
生成，轉成真人後動作會與參考一致。

影片專案

參考音訊

用途上傳配音，指定影片中不同角色使用的聲音。

適合情境要讓影片中的角色用指定的聲音講台詞。

操作步驟

錄製約 10 秒的聲音，最多可上傳 3 段。
於提示詞指定角色配音（例：男生用 Audio1、女生用 Audio2）。
生成，系統以對應聲音講出台詞。

C. 創作流工作室

創作流工作室

無限網紅分身（虛擬主播 / Podcast）

用途上傳虛擬人物＋輸入講稿，由 KLING 3.0 生成虛擬主播影片，並以首尾幀串接成任意長度。

適合情境要做知識型 Podcast、虛擬主播、長口播影片。

無限網紅分身：左側設定秒數與畫質（KLING 3.0：Std／Pro／4K），中間為依字幕自動切分的各段，逐段以「首尾針」銜接　（提示詞／機密數字已遮蔽）

操作步驟

上傳虛擬人物（專業知識型可用 16:9，桌上能擺商品）。
左側貼上「要講的內容」逐字稿（可先用 GPT 生成口播稿）。
選每段秒數（建議 5 秒：快、失敗率最低）與畫質（先 Std 測試，OK 再轉 Pro≈720p）。
系統依文字長度自動切段並逐段生成。
可於「動作提示詞」微調表情動作；不要鏡頭推拉就加固定鏡頭指令。
每段完成點「首尾針」擷取尾幀作下一段首幀；最後下載合併、上字幕。

優點

文字越長段數越多——2000～3000 字可做 10 分鐘以上。

KLING 3.0 會自動生成符合該人臉的聲音，換場景／髮型聲音仍一致。

創作流工作室

知識影片導演 / 劇場（旁白說書）

用途卡通／虛擬人物知識影片，搭配「說書式旁白」念稿（非人物本人講話）。

適合情境經營卡通頻道、Q 版人物說明、知識說書型影片。

操作步驟

建立／指定虛擬人物（畫風決定成品風格）。
於「聲音參考」錄一段聲音轉成 TTS 旁白；或選不生成語音、只生影片。
輸入主題，系統發想完整旁白文案，可再修改。
按「確認切分」切成所需格數。
生成所有影片；注意音畫同步（例：把 5 秒畫面縮成 4 秒對齊旁白）。

創作流工作室

UGC 帶貨（影片版）

用途由人物照＋商品快速生成帶貨影片，自動產生台詞。

適合情境要快速產出真人感的商品帶貨短片。

操作步驟

上傳人物與商品，按「直視」生成帶貨圖。
選影片引擎：可靈 3.0 或 C-DANCE 2.0。
生成腳本並產生音訊；系統分析圖片自動產生台詞（可中／英文）。
進階：下載成品丟回影片專案接續，延伸出不同台詞的第二段。

創作流工作室

廣告影片創作大師（招牌功能）

用途業界標準工作流：角色三視圖＋產品圖＋分鏡版 → 生成分鏡腳本 → 15 秒廣告片。

適合情境要做專業廣告短片，場景控制與人物一致性最高。

廣告影片創作大師：左側設定故事地點／風格／情緒／分鏡數量(9格)／比例；右側產出電影分鏡腳本與角色六視圖（成品展示）　（提示詞／機密數字已遮蔽）

操作步驟

先用「UGC 三視圖」做角色圖；準備產品參考圖（建議白底）。
設定故事地點、廣告風格、情緒氛圍；分鏡數量建議 9 格、比例 16:9、平台 KIE.ai。
按「生成故事腳本」產出結構化分鏡腳本（鏡頭 1～9）。
確認後按「確認・生成分鏡板」，產出近 2K～4K 分鏡圖。
影片提示詞：「讓 image1 與 image2 跟著 image3 的分鏡腳本」（角色圖／產品圖／分鏡版）。
用 C-DANCE 2.0 生成 15 秒廣告片。
升畫質：先出 720p，再用 fal.ai upscale 升 1080p（每秒幾美分，比直接出便宜）。

延伸用法

要超過 60 秒：請 GPT／Claude 改各鏡頭動作，再依「延伸長影片」接續。

D. 圖片智能功能

圖片智能

大量改圖小幫手

用途批量上傳圖片，套用同一段提示詞一次改完並批量下載。

適合情境賣場需要大量、風格一致地出圖。

大量改圖小幫手：批量上傳 → 設定提示詞與浮水印 → 批量生成 → 批量下載（成品展示）　（提示詞／機密數字已遮蔽）

操作步驟

點擊或拖曳上傳多張圖片（支援 JPG／PNG／WEBP）。
輸入要套用的提示詞；需要的話開啟浮水印並設定位置／大小／透明度。
按「開始批量生成」，完成後一鍵批量下載。

圖片智能

人物產品多角度（需 fal.ai key）

用途生成同一人物／產品的不同角度，可控制垂直與左右角度。

適合情境服裝、時尚廣告需要多角度 model；產品要多視角展示。

操作步驟

於「API 設定」填入 fal.ai key。
上傳人物／產品，調整垂直與左右角度參數。
生成所需的各個角度圖。

圖片智能

快速產品圖（電商九宮格）

用途輸入商品資訊，自動生成電商（如蝦皮）九宮格產品圖與文案，可多風格套組。

適合情境電商上架要快速產出整套商品圖與文案。

快速產品圖：填商品名稱／品類／核心賣點／目標客群並上傳產品圖，系統產出 9 張套圖與文案　（提示詞／機密數字已遮蔽）

操作步驟

填寫商品資訊：商品名稱、品類類型、核心賣點、目標客群。
上傳產品參考圖（實體商品）；服務類（醫美／SPA）則上傳人物或診所名稱。
選擇產品類型，系統自動生成對應的 prompt 與文案。
確認文案後生成 9 張圖（p1～p9）。
需多風格時，於右側「新增套組」再生成另一組同文案、不同風格的圖。

💰 點數與成本

項目	成本概念
C-DANCE 1080p 直接生成	約 700 點／次，最貴，不建議
15 秒影片生成	約 270 點（偏高，使用前先評估）
fal.ai 影片升畫質（upscale）	每秒約幾美分，最省，建議先低解析度再升 1080p
畫質 Stand vs Pro	先用 Stand 測試 → 確認後轉 Pro（Pro ≈ 720p，較便宜）
可靈 3.0	一步約 70～80 點，較便宜，且自動生成符合人臉的聲音

省錢三原則

1. 先低後高：先用 480p／Stand 測試，OK 再升解析度。

2. 升畫質走 fal.ai upscale，不要直接用 C-DANCE 出 1080p。

3. 長影片用 5 秒分段接續，失敗率最低、最省重做成本。

❓ 常見問題（FAQ）

Q：要做 60 秒以上的影片？

A：把腳本切成多張分鏡圖，用「延伸長影片（VDO1 接續）」逐段串接。

Q：人物在不同鏡頭長得不一樣？

A：務必先用「UGC 三視圖」做角色圖，才能維持人物與姿勢一致。

Q：提示詞要中文還英文？

A：建議把 @1、@2 改寫成 image1、image2，並用英文描述場景／動作。

Q：想要 1080p 但太貴？

A：先出 720p，再用 fal.ai upscale 升 1080p，每秒僅幾美分。

Q：虛擬主播聲音可以換嗎？

A：KLING 3.0 以該人臉生成後聲音即固定；需不同聲音請改用其他工作流或參考音訊。

Q：分鏡圖解析度設多少？

A：建議 4K。

適用對象	客戶（電商／品牌行銷／自媒體經營者）與教學人員
版本	v1.1（草稿，截圖已遮蔽機密提示詞）
建立日期	2026-06-05