你覺得好的文案,使用者不一定買單
做 Google Ads 最容易犯的一個錯誤,就是用自己的感覺來判斷文案好不好。你覺得「業界領導品牌」很有氣勢,結果使用者覺得這句話空洞無比。你覺得「限時 7 折」太俗氣不想用,結果這句話的點擊率比你精心寫的文案高了一倍。
感覺是靠不住的。能靠的只有數據。
A/B 測試就是用數據來告訴你答案的方法。你拿兩個版本的廣告同時跑,在其他條件都一樣的情況下,看哪個版本的表現更好。聽起來很簡單,但要做得正確,裡面有不少眉角。
這篇不是跟你講 A/B 測試的教科書理論,而是分享我們實際操作 Google Ads 文案測試的方法,包含那些踩過的坑和學到的教訓。
RSA 時代的測試方式跟以前不一樣了
如果你還在想著「寫兩則完全不同的廣告然後看誰贏」,那你的觀念需要更新了。
在以前用展開式文字廣告(ETA)的時代,A/B 測試很直覺:廣告 A 用這套標題和說明,廣告 B 用另一套,跑一段時間比結果。但 Google 從 2022 年開始就不再支援新建 ETA 了,現在所有的搜尋廣告都是回應式搜尋廣告(RSA)。
RSA 的機制是你提供多組標題和說明,Google 自動幫你組合。這讓 A/B 測試變得更複雜,但也更有趣。
在 RSA 的架構下,你的測試策略有兩種主要方向:
第一種:在同一個廣告群組裡放兩則 RSA。每則 RSA 用不同的文案策略。比方說 RSA A 主打價格優勢,RSA B 主打品質和信任。Google 會在兩則之間分配流量,你可以比較它們的整體表現。
第二種:用 Google Ads 的「實驗」功能。這是更嚴謹的做法。你可以建立一個實驗活動,把流量 50/50 地分給原始版本和實驗版本,Google 會幫你做統計顯著性分析。
第二種方法更科學,我們通常建議用這種。
測試什麼比怎麼測試更重要
很多人一聽到 A/B 測試就興致勃勃地改了一堆東西,結果什麼結論都得不出來。因為你同時改了太多變數,就算結果有差異,你也不知道是哪個改動造成的。
好的測試,一次只測一個變數。以下是值得測試的變數,按照影響力排序:
1. 價值主張的角度 這是影響最大的變數。你的廣告主打什麼?是價格?品質?速度?售後服務?安全性?
範例測試:
- 版本 A:「全場 85 折起,免運費直送到家」(主打價格)
- 版本 B:「日本原裝進口,品質保證 3 年保固」(主打品質)
2. 社會證明 vs. 功能特點 有些受眾對別人的評價很敏感,有些受眾更在意產品本身。
範例測試:
- 版本 A:「超過 10,000 位企業主的選擇」
- 版本 B:「AI 自動化報表,省下 80% 人工時間」
3. CTA 的措辭 行動呼籲的用詞會影響使用者的行動意願。
範例測試:
- 版本 A:「免費試用 14 天」
- 版本 B:「立即預約免費諮詢」
4. 數字的使用方式 同樣的資訊,用不同的數字表達方式,效果可能差很多。
範例測試:
- 版本 A:「節省 40% 的成本」
- 版本 B:「每月省下 $15,000」
實驗設計的注意事項
要得到可靠的測試結果,實驗設計要嚴謹。以下是幾個關鍵的注意事項。
樣本量要夠大:如果你的廣告一週只有 50 個點擊,那跑一週的測試是不夠的。統計上至少需要每個版本 100 個以上的轉換(不是點擊)才能得出比較可靠的結論。如果你的轉換量不大,就要有耐心跑更長的時間。
測試期間不要動其他設定:當你在跑 A/B 測試的時候,不要同時去改出價策略、預算、目標對象、或是著陸頁。任何一個改動都可能影響結果,讓你的測試資料變得不可信。
考慮時間因素:不要用只跑了週末兩天的數據下結論。不同的星期幾、不同的時段,使用者行為可能有很大的差異。至少跑一到兩個完整的商業週期(通常是兩週)。
注意季節性和特殊事件:如果你的測試剛好跨到一個大促銷、節日、或是產業的淡旺季交替,結果可能會被這些外部因素影響。盡量選擇比較平穩的時段來做測試。
記錄每一次測試:用試算表或筆記工具記錄每次測試的假設、變數、開始和結束時間、結果、以及你的結論。時間久了,這些記錄會變成你最寶貴的廣告知識庫。
怎麼看數據才不會被騙
數據會說話,但也可能說謊。以下是判讀測試結果時要注意的事。
統計顯著性:這是最重要的概念。如果版本 A 的轉換率是 3.2%,版本 B 是 3.5%,這 0.3% 的差異到底是真的差異,還是只是隨機波動?統計顯著性就是在回答這個問題。
Google Ads 的實驗功能會直接告訴你結果是否具有統計顯著性。如果你自己做測試,可以用免費的統計計算工具(搜尋「AB test significance calculator」就有很多)。一般用 95% 的信心水準,也就是說你有 95% 的把握差異是真的。
不要只看 CTR:點擊率高不代表這個廣告就是贏家。如果版本 A 的 CTR 比較高,但版本 B 的轉換率比較高、CPA 比較低,你應該選版本 B。最終要看的指標是跟你的商業目標最相關的那一個——通常是轉換率、CPA、或 ROAS。
注意平均值的陷阱:整體平均表現可能掩蓋了分群的差異。也許版本 A 在手機上表現比較好,版本 B 在電腦上表現比較好。如果你的流量主要來自手機,那你應該選版本 A。試著從裝置、地區、時段等維度分別看數據。
小心「贏家的詛咒」:如果你同時跑了很多組測試,純粹靠運氣也會有幾組出現「顯著差異」。測試的組數越多,出現假陽性的機率越高。這就是為什麼一次只測一個變數比較好。
測試的節奏和持續性
A/B 測試不是做一次就夠了,它應該是你廣告管理流程的固定環節。
我們建議的節奏是:
每個月至少做一次文案測試。不用大改,可以只測試一個新的標題角度或一種新的 CTA 說法。持續的小測試比偶爾的大測試更有用。
建立你的測試待辦清單。把所有想測試的假設記錄下來,按照預期影響力排序。每次啟動新測試的時候從清單最上面開始。
把學到的東西應用到其他廣告群組。如果你在某個廣告群組測出「具體數字比模糊形容詞有效」,這個結論很可能也適用於其他群組。但還是建議在每個群組都驗證一次,因為不同的受眾和關鍵字可能會有不同的反應。
定期重新測試舊的結論。市場會變、競爭對手會變、使用者的偏好也會變。半年前的測試結論現在可能已經不適用了。每半年重新驗證一次你的核心文案策略是個好習慣。
幾個我們實際測過的有趣發現
分享幾個我們在操作客戶帳戶時測出來的結論,不一定適用於所有產業,但可以當作你的測試起點。
具體金額比百分比更有感覺:「每月省下 $8,000」的效果通常比「節省 30%」好。因為使用者不想自己算,直接告訴他能省多少錢更有衝擊力。但如果金額太小(比如省 $50),百分比反而更好看。
問句標題在某些情況下很有效:「還在為加班報表煩惱嗎?」這種問句標題在 B2B 的場景表現特別好。因為它直接戳中了使用者的痛點。但在電商場景,直述式的標題(像「免運費全場 85 折」)表現更好。
加入時間元素可以提升急迫感:「本週限定」「倒數 3 天」這類時間限制,通常可以提升 10-20% 的 CTR。但如果你長期都在用「限時」,使用者會免疫。真正的限時活動才有效果。
品牌名稱放在標題裡有時候有用有時候沒用:如果你的品牌已經有知名度,放品牌名稱可以提升信任感。但如果沒人聽過你的品牌,這個位置拿來放 USP 更好。
不測試就是在燒錢
最後講一句比較直接的話:如果你花了預算在 Google Ads 上面跑廣告,但從來不做文案的 A/B 測試,你就是在浪費錢。
因為你用的文案可能不是最好的版本。也許換一個標題,你的 CTR 可以提升 20%。也許換一種 CTA,你的轉換率可以提升 15%。這些改善疊加起來,對你的廣告成本和營收的影響是巨大的。
A/B 測試不需要什麼高深的技術或昂貴的工具。Google Ads 後台就有內建的實驗功能,免費、好用、還會幫你算統計顯著性。你需要的只是一個假設、一點耐心、和願意讓數據說話的心態。
別再猜了,開始測吧。