這是什麼實驗
2026 年 6 月 8 日,我們啟動一個實驗:讓 AI(Antigravity 2.0,Opus 4.6)自己寫、自己發五個網站(aicoding.tw / aicoach.tw / aiart.tw / aivideo.tw / aimusic.tw)的部落格文章,全程不需要人手動介入寫作與發布。原訂目標是驗證「內容自動化」這件事在現階段是否可行,計畫跑滿四週。
2026 年 7 月 2 日,作者判定生成文章品質持續不達最低標準,提前結束整個實驗,改採另一套「真實案例+既有觀點」的內容生產流程(Curated Blog Automation)。
這篇文章把整個過程攤開:我們具體建了哪些 Harness(工作環境與規則)、五站在這段期間實際生出的全部文章、以及品質為什麼始終沒有達標的真正原因。
一、我們建了哪些 Harness(工作環境與規則)
「Harness Engineering」指的不是讓 AI 更聰明,而是設計 AI 的工作環境——給它清楚的邊界、檢查點、和犯錯後的修正機制。這次實驗裡,我們實際建了以下幾層:
1. 發布前衛生檢查:C1–C6 品質閘
每篇文章發布前,必須通過六道檢查:
- C1 翻譯測試:搜尋全文有沒有出現「五個網站」「五站」「aicoding」「aiart」等跨站洩漏詞(排除當站站名)。
- C2 禁用詞:搜尋「IDAW」「I Dream AI Works」「IDOL」「OPC」「NPC」「Agent 軍團」「一人公司」等詞;各站再加站別專屬禁詞(例如 aicoachtw 額外禁止「解鎖」「打怪」「升級」「裝備」「掉寶」這類遊戲化詞彙,aiarttw / aimusictw 額外禁止「商業模式」「規模化」「SOP」「框架」這類顧問腔)。
- C3 具體細節:文章裡有沒有實質的數字、工具名稱、步驟。
- C4 模版結構:是否至少有 4 個 H2 小標。
- C5 網址(Slug):是否避開「ai」這類過於通用、SEO 價值低的字。
- C6 Clippings 來源核對:若文章來源標註為某篇 Clippings 範文,內容是否確實對應。
其中 C1、C2 若檢查失敗,系統會自動改寫問題句子後重新發布——這是整套機制裡唯二會自動修正內容的規則。
2. 三維度量化評分系統(S1/S2/S3,滿分 100)
單純的及格/不及格不夠精細,後來我們設計了一套把「這篇文章好不好」拆解成三個維度、各自再拆成子項目的評分系統:
- S1 搜尋對齊(35 分):S1a 搜尋意圖命中(15 分)、S1b 關鍵字佈局(12 分:標題/前 100 字/至少 2 個 H2/meta description 各 3 分)、S1c 長尾自然覆蓋(8 分)。
- S2 點擊吸引力(25 分):S2a 標題點擊率(15 分)、S2b 開頭黏著力(10 分:前三行或前 80 字能不能留住讀者)。
- S3 讀者共鳴(40 分):S3a 問題解決度(15 分)、S3b 內容具體度(12 分)、S3c 行動落地(8 分:讀完有沒有一件今天能做的事)、S3d 獨特觀點(5 分:這篇有沒有別處找不到的洞見)。
總分對應等級:S(90+,加入範例庫)/A(80+,合格發布)/B(70+,可接受)/C(60+,需記錄根因)/D(<60,需重寫)。
3. 每日與每週排程
- 每日 12:30(daily-blog-quality-gate):抓當天發布的文章 → 用 HTTP 請求驗證是否真的上線 → 跑 C1/C2 自動修正 → 跑 S1/S2/S3 評分 → 把結果寫進 `DAILY-OPTIMIZATION-LOG.md` → 覆寫一份 `NEXT-DAY-HINTS.md` 給隔天的 Antigravity 讀 → 用推播通知回報。
- 每週一 11:00(weekly-blog-quality-review):讀一週份的每日紀錄 → 做 B-M-L(Build 做了什麼/Measure 數字說了什麼/Learn 學到什麼)分析 → 對 `AGENTS.md`(系統的核心規則文件)提出修改建議(只寫建議,不自動執行,必須經人審核採納)→ 若有 90 分以上的 S 級文章,把它的寫作技法萃取進範例庫 → 把當週最典型的失敗案例寫進失敗案例庫 → 自動產出五站「公開檢討」週報草稿(不自動發布,等人回覆「全部發布」才上架)。
4. 標題公式庫(2026-06-15 採納,唯一真正落地的規則改動)
我們發現標題是最先拖累 S2(點擊吸引力)分數的地方,於是建了一份含 30 種標題公式的資料庫,每種公式標注對應的心理觸發、適合的文章類型、以及品牌安全等級(🟢可用/🟡斟酌/🔴禁用,例如限時、FOMO、挑釁類公式列為紅燈)。之後規定每篇文章的標題必須走「判斷類型 → 決定觸發點 → 生 5 個不同角度的候選標題 → 過 S2 閘 → 選出最強的一個」這個流程,不能只寫一個版本就發。
5. 失敗案例庫(ANTI-PATTERNS.md)
比起抽象規則,直接記錄「這句話發布過、被抓到、不能再犯」的真實反例更有效。裡面最嚴重的一類是「AI 佈道語調」——因為四個創作站(aicoding / aiart / aivideo / aimusic)的讀者,本身正承受著 AI 可能取代自己工作的焦慮,任何說教式的鼓勵句都會造成反效果。例如:
- ❌「AI 時代充滿機會,只要你願意改變」——等於在說「你的問題是你不夠努力」。
- ❌「擁抱 AI,讓它成為你的超級武器」——「擁抱」這個詞本身對 AI 焦慮的讀者是反感的。
- ❌「AI 不會取代你,取代你的是不會用 AI 的人」——聽起來像安慰,實際上是把焦慮轉嫁成讀者的責任。
6. 其他實際落地的修正
- 建立五站共用的情感寫作框架(`WRITING-SKILL.md`),整合進每篇文章生成前必經的步驟。
- 把「NPC」這個標籤從所有指導文件中移除(NPC 框架只保留在書和 idreamaiworks.com,不該出現在四個垂直站)。
- 修正 aiart.tw 的工具設定:主理人 Lazzyu 實際只用 ChatGPT Image 2.0 和 Gemini Nano Banana Pro,禁止文章提到 Midjourney。
- 累積 14 條從真實好文章(兩本電子書+Clippings 範文)拆解出的寫作技法模版。
以上這些,是規則層面確實做出來、確實在跑的東西。規則設計本身,其實相當完整。
二、實驗期間五站生成的全部文章(103 篇)
以下是 2026-06-08 至 2026-07-01 期間,五站實際發布的所有文章,依站台分類、依日期排序。點標題可看原文(原網址持續有效,作為歷史存檔保留)。
aicoding.tw(共 22 篇)
| 日期 | 標題 |
|------|------|
| 2026-06-08 | 我用 Claude Code 解鎖了五站日更自動化外掛 |
| 2026-06-09 | 3個方法讓你的 side project 被 AI 搜尋推薦 |
| 2026-06-10 | 寫程式別再先學再做!AI 時代當 AI Boss 讓 Claude Code 當你的超級員工 |
| 2026-06-10 | Prompt、Context、Harness Engineering 都會被 AI 取代,Boss Engineering 才是人類唯一的優勢 |
| 2026-06-11 | 我用 Claude Code 同時刷了3個小工具:AI一人公司的100倍練功速度 |
| 2026-06-13 | AI 自動寫文章第一週:我們發現 AI 在捏造,然後做了 9 件事 |
| 2026-06-13 | 為什麼「自己動手改 code」是 AI 時代最蠢的卡關? |
| 2026-06-15 | 怎麼用 Claude Code 做出可以賣的東西?0 元解鎖你的個人網站三大神級裝備 |
| 2026-06-16 | 非工程師用 Claude Code 最常犯的 3 個錯:你是不是也在單機打怪? |
| 2026-06-17 | 欸超爽!Claude Code 新手第一個作品:我用 1 小時解鎖自動發片外掛 |
| 2026-06-18 | 即使不會寫程式,也能用 Claude Code 做出可以賣的東西!超狂「零風險」接案法 |
| 2026-06-19 | 不會寫程式可以用 Claude Code 嗎?欸,這套三位一體裝備讓你直接解鎖成品! |
| 2026-06-20 | 我用 Claude Code 解鎖了 1+7 全套開發裝備 |
| 2026-06-21 | 即使不會寫程式,也能用 Claude Code 做出可以賣的東西! |
| 2026-06-23 | 我用 Claude Code 做出第一個作品:解鎖繁中斷行修正外掛 |
| 2026-06-24 | 怎麼用 Claude Code 做出可以賣的東西?0 元成本解鎖你的第一個產品 |
| 2026-06-25 | 不會寫程式也能做產品?打開 Claude Code 當你的 AI CEO |
| 2026-06-26 | 欸超爽!Claude Code 新手第一個作品:我用 1 小時拓印了漂亮網頁的設計系統 |
| 2026-06-27 | 怎麼用 Claude Code 做出可以賣的東西?3 步把你的獨特想法變成無法複製的產品 |
| 2026-06-28 | 不會寫程式可以用 Claude Code 嗎?解鎖 24 小時「並行掛機模式」,讓 AI 替你直接破關 MVP |
| 2026-06-29 | 欸超爽!我只用 2 個保護機制:3 週解鎖 Claude Code 新手第一個作品 |
| 2026-07-01 | 不會寫程式可以用 Claude Code 嗎?為什麼你該讓 AI 幫你賣程式給另一個 AI? |
aicoach.tw(共 22 篇)
| 日期 | 標題 |
|------|------|
| 2026-06-08 | 我用 Agent 部署了五站 Blog 的自動化發布系統 |
| 2026-06-09 | 3個方法讓你的教練品牌內容被 AI 搜尋推薦 |
| 2026-06-10 | 擺脫一對一教學時間上限!如何用 AI 助理建立可複製的個人教練事業系統 |
| 2026-06-10 | Prompt、Context、Harness Engineering 都會被 AI 取代——教練真正需要的是 Boss Engineering |
| 2026-06-11 | 第4週:我用 AI 助理同時測試3個課程定位,我的教練事業建造過程 |
| 2026-06-13 | 建立 AI 內容自動化的第一週:9 個讓品質穩定的系統設計 |
| 2026-06-13 | 為什麼「幫學員修改細節」是 AI 時代最危險的教練習慣? |
| 2026-06-15 | 如何把專業系統化成可以教的課程?AI 教練事業的三大獲客與成交系統設計 |
| 2026-06-16 | 獨立教練在系統化過程中常犯的 3 個錯誤:你是否忽略了學員的回饋迴路? |
| 2026-06-17 | AI 教練事業建造過程:如何用 2 個硬交接步驟建立可複製的影音系統 |
| 2026-06-18 | 如何把專業系統化成可以教的課程?讓你的影響力與收入規模化的 3 個 SOP |
| 2026-06-19 | AI 時代教師教練還有價值嗎?為什麼你的專業需要轉型為系統化事業 |
| 2026-06-20 | 我如何將教練事業升級成 1+7 系統化課程體系 |
| 2026-06-21 | 3 個步驟把專業系統化成可以教的課程,用 AI 突破時間天花板 |
| 2026-06-23 | AI 教練事業建造過程:我將 CJK 斷行修正導入個人品牌網站 |
| 2026-06-24 | 如何把專業系統化成可以教的課程?3 個步驟突破一對一時間天花板 |
| 2026-06-25 | AI 時代教師教練還有價值嗎?用 Claude Code 建立你的可複製系統 |
| 2026-06-26 | AI 教練事業建造過程:我們如何用逆向工程框架推出 3 個實戰課程模組 |
| 2026-06-27 | 如何把專業系統化成可以教的課程?3 步驟將你的核心方法論打造成 AI 無法複製的品牌護城河 |
| 2026-06-28 | AI 時代教師教練還有價值嗎?為什麼轉向「並行系統化」是突破時間天花板的關鍵 |
| 2026-06-29 | 從一鍵生成初稿到三輪品味對齊:我的 AI 教練事業建造過程 |
| 2026-07-01 | AI 時代教師教練還有價值嗎?為什麼你該讓 AI 幫你賣課程給另一個 AI? |
aiart.tw(共 20 篇)
| 日期 | 標題 |
|------|------|
| 2026-06-08 | 我把發文這件事外包給 AI 了 |
| 2026-06-09 | 3個方法讓你的 AI 創作品牌被 AI 搜尋推薦 |
| 2026-06-10 | 接案畫手永遠建不了護城河!用 AI 創作做自己的品牌才是稀缺資產 |
| 2026-06-11 | 第5週:我用 Midjourney 同時測試3種風格,我的 AI 創作品牌建造過程 |
| 2026-06-13 | 為什麼「動手幫客戶修圖」是 AI 時代最蠢的卡關? |
| 2026-06-15 | 怎麼用 Midjourney 建立自己的視覺風格?0 元打造你的 AI 創作獲客與成交系統 |
| 2026-06-16 | 為什麼一直單機接案,是 AI 創作者最難賺到錢的死胡同? |
| 2026-06-17 | AI 創作品牌建造過程:我用 1 張全景圖加上紅線解鎖一鏡到底 FPV |
| 2026-06-18 | 怎麼用 Midjourney 建立自己的視覺風格?不藏私分享我的 3 個私房調色祕密 |
| 2026-06-19 | 接案 AI 繪圖還是建立品牌哪個比較好?欸,認真說,建立自己的視覺品牌有夠爽! |
| 2026-06-20 | 我以前只管畫圖,今天我決定解鎖 1+7 創作者完整地圖 |
| 2026-06-21 | 3 個步驟用 AI 建立自己的視覺風格,告別被客戶牽著走的接案日子 |
| 2026-06-23 | AI 創作品牌建造過程:我用 CJK 斷行修正拯救了碎掉的畫作標題 |
| 2026-06-24 | 怎麼用 AI 建立自己的視覺風格?3 個步驟告別改圖改到哭的接案生活 |
| 2026-06-25 | 接案 AI 繪圖還是建立品牌哪個比較好?主理人 Lazzyu 的 AI 創作者品牌經營實戰 |
| 2026-06-26 | AI 創作品牌建造過程:我用 3 層設計 tokens 拓印出作品集的視覺質感 |
| 2026-06-27 | 怎麼用 AI 建立自己的視覺風格?3 步將你的獨特美感變成無法被複製的品牌護城河 |
| 2026-06-28 | 接案 AI 繪圖還是建立品牌哪個比較好?欸,別傻了,用「並行生圖系統」24 小時通關你的視覺品牌 |
| 2026-06-29 | 欸,從風格失控到 80 分風格鎖定:我的 AI 創作品牌建造過程 |
| 2026-07-01 | 接案 AI 繪圖還是建立品牌哪個比較好?為什麼你該讓 AI 幫你賣風格給另一個 AI? |
aivideo.tw(共 20 篇)
| 日期 | 標題 |
|------|------|
| 2026-06-08 | 我把發文時間搶回來了,全部拿去剪片 |
| 2026-06-09 | 3個方法讓你的影片網頁被 AI 搜尋推薦 |
| 2026-06-10 | 別再和演算法死拼了!把剪片交給 AI,用影片建立你自己的自動化資產 |
| 2026-06-11 | 第6週:我用 AI 影片工具同時跑3種腳本,我的 AI 影片事業建造過程 |
| 2026-06-13 | 為什麼「自己手動剪片」是 AI 時代最蠢的卡關? |
| 2026-06-15 | 怎麼用 Runway 縮短 80% 影片剪輯時間?0 元解鎖你的影片獲客與自動成交漏斗 |
| 2026-06-16 | 為什麼每天追著演算法跑,是影片創作者最快陣亡的原因? |
| 2026-06-17 | AI 影片事業建造過程:我用大場景加紅線在 1 小時內搞定一鏡到底 Short |
| 2026-06-18 | 怎麼用 AI 工具壓縮影片製作時間?不藏私教你直接省下 80% 剪片時間的 3 招 |
| 2026-06-19 | 靠演算法還是建立影片資產哪個更穩?欸,別傻了,這招直接把影片變資產! |
| 2026-06-20 | 我以前只會瘋狂剪片,今天我決定用 1+7 裝備建立影片工廠 |
| 2026-06-21 | 3 個步驟用 AI 加速影片製作,告別被演算法綁架的剪片日子 |
| 2026-06-23 | AI 影片事業建造過程:我用 CJK 斷行修正提升了影片著陸頁的轉化率 |
| 2026-06-24 | 怎麼用 AI 工具壓縮影片製作時間?3 個步驟告別剪片剪到死的日子 |
| 2026-06-25 | 靠演算法還是建立影片資產哪個更穩?AI 影片創作者的破局思維 |
| 2026-06-26 | AI 影片事業建造過程:我用 1 支爆款短影音逆向出 4 套影片模版 |
| 2026-06-27 | 怎麼用 AI 工具壓縮影片製作時間?3 步驟將剪輯交給 AI,把你的獨特故事靈魂變成最強護城河 |
| 2026-06-28 | 靠演算法還是建立影片資產哪個更穩?別再瘋狂剪片了,用 AI 並行流 24 小時通關影片事業 |
| 2026-06-29 | 欸,從無限修改腳本到 80 分保護:我的 AI 影片事業建造過程 |
| 2026-07-01 | AI 影片製作如何建立個人品牌?為什麼你該讓 AI 幫你賣影片給另一個 AI? |
aimusic.tw(共 20 篇)
| 日期 | 標題 |
|------|------|
| 2026-06-08 | 我把打斷靈感的發文雜務交給 AI 了 |
| 2026-06-09 | 3個方法讓你的音樂網頁被 AI 搜尋推薦 |
| 2026-06-10 | 旋律做不出來?教你用 AI 音樂工具填補技術缺口,打造自動運作的音樂收入系統 |
| 2026-06-11 | 第3週:我用 AI 同時生成3種編曲 demo,我的 AI 音樂事業建造過程 |
| 2026-06-13 | 為什麼「手動微調音軌」是 AI 時代最蠢的卡關? |
| 2026-06-15 | 怎麼用 Suno 做出完整的歌?0 元打造你的 AI 音樂獲客與自動成交漏斗 |
| 2026-06-16 | 為什麼一直關在房間裡做 Demo,是 AI 音樂人最難被聽見的死穴? |
| 2026-06-17 | AI 音樂事業建造過程:我用 ElevenLabs 口播與 AI 配樂解鎖頻道登場 Short 的 vibe |
| 2026-06-18 | 怎麼用 AI 音樂生成工具做完完整整的歌?不藏私分享我的 3 個音樂起草祕密 |
| 2026-06-19 | 學樂器還是用 AI 作曲哪個更快有收入?欸,認真說,先用這套三位一體裝備把 vibe 做出來! |
| 2026-06-20 | 我以前只在房間做 Demo,今天我決定用 1+7 裝備給音樂找個家 |
| 2026-06-21 | 3 個步驟用 AI 編曲完成你的 Demo,解鎖你的第一筆音樂被動收入 |
| 2026-06-23 | AI 音樂事業建造過程:我用 CJK 斷行修正保住了歌詞頁面的完美 vibe |
| 2026-06-24 | 怎麼用 AI 工具做出有收入的音樂?3 個步驟解鎖你的個人音樂品牌 |
| 2026-06-25 | AI 音樂可以商用嗎還是會被版權告?主理人 Yunnico 的 AI 音樂品牌與商業變現路徑 |
| 2026-06-26 | AI 音樂事業建造過程:我用 1 首爆款歌曲的氛圍指紋逆向出編曲模版 |
| 2026-06-27 | 難以被複製的旋律:用 AI 自動生成旋律,把你的獨特情感靈魂打造成無法複製的品牌護城河 |
| 2026-06-28 | 學樂器還是用 AI 作曲哪個更快有收入?欸,別傻了,開啟 AI 並行流 24 小時通關音樂事業 |
| 2026-06-29 | 欸,從 hook 一直被改掉到 80 分氛圍鎖定:我的 AI 音樂事業建造過程 |
| 2026-07-01 | AI 音樂創作怎麼申請版權?為什麼你該讓 AI 幫你賣音樂給另一個 AI? |
三、品質為什麼始終沒有達標——真正的根因
规则做得這麼細,為什麼三週後我們還是判定「不達標」而喊停?回頭看每週的內部記錄,答案不是規則不夠嚴,而是驗證這件事本身,一直沒有被真正做到。
第一週(W25,06-15 週報):起步就只有 1 天有數據
第一週的週回顧顯示,過去七天裡只有 1 天(06-10)留下完整記錄。當天的檢查結果:C1、C2、C3 全數通過,但 C4(結構)5 站中有 2 站沒過,C5(網址)5 站中有 4 站踩到「ai」這個通用詞——換句話說,網址通過率只有 20%。同時也觀察到「勵志填充句」反覆出現的問題(「懂我意思嗎?」「這是一場必輸的遊戲」這類沒有實質資訊的句子)。
第二週(W26,06-26 週報):號稱一週,其實只有 1 天,而且還漏了一站
第二週的週報同樣只找到 1 天(06-19)的有效評分紀錄,其中 aivideo.tw 那天發布時遇到伺服器錯誤(HTTP 500),該篇文章直接被排除評分,只剩四站可比較。四站當天平均 80.75/100(A 1 篇、B 2 篇、C 1 篇),最弱的是 S1b「關鍵字佈局」,平均只拿到 68.75% 的分數——其中 aicoachtw 那篇的所有 H2 小標都是通用標題,沒有一個放進目標關鍵字。
這一週我們正式採納了第一個規則改動:導入標題公式庫。但因為評分資料本身就稀疏,這個改動到底有沒有讓分數變好,其實也沒有足夠的樣本可以驗證。
第三週(W27,06-29 週報):產量最高的一週,評分卻是空白的一週
第三週的記錄最直接地暴露了問題。這一週五站在 6 天內合計發布了 30 篇文章——是整個實驗期間單週產量最高的一次。但翻開 `DAILY-OPTIMIZATION-LOG.md`,這 30 篇文章裡,沒有一篇留下 S1/S2/S3 評分紀錄。週報裡的原話是:「就像工廠出貨 30 件,但沒有任何品管記錄。」
貫穿整個實驗的一個事實:「已驗證有效規則」清單,從頭到尾是空的
我們原本設計了一個機制:每次對 `AGENTS.md` 提出的修改建議,都要經過「提出 → 採納 → 連續兩週追蹤分數 → 確認真的有效」這個完整流程,通過的才會被記錄進「已驗證有效規則」清單,成為之後可以放心沿用的固定規則。
從實驗開始到喊停,這份清單裡一條記錄都沒有。不是因為沒有規則被採納——標題公式庫確實採納了;是因為採納之後,追蹤驗證所需要的每日資料,本身就時常斷鏈,導致沒有任何一個假設真正走完這個迴圈,被證實或推翻。
結論:問題不在規則不夠細,而在執行本身不可靠
把這三週的事實放在一起看,會發現一個清楚的模式:
1. 我們花了不少力氣設計了一套相當完整的品質控管系統(六道發布前檢查、三維度百分制評分、每日與每週的自動審查排程、失敗案例學習機制)。
2. 但這套系統要真正發揮作用,前提是「每天都確實被執行、每篇都確實留下數據」。
3. 實際情況是:發布流程本身會出錯(HTTP 500)、評分紀錄常常沒有真的被寫入、產出速度(一週 30 篇)遠遠超過品質驗證迴圈能跟上的速度。
4. 結果是規則一直在加,但沒有任何一條規則被完整驗證過有沒有用——因為驗證這件事,本身就沒有被穩定地做到。
換句話說:這不是「AI 寫得不夠好」的問題,而是「我們沒有可靠地確認 AI 寫得好不好」的問題。沒有穩定的驗證迴圈,任何規則改進都只是假設,永遠無法變成真正被證實的知識,品質自然也就無法真正累積、複利式地變好。
四、接下來怎麼做
基於以上結論,我們做了以下決定:
1. 終止全自動生成式的內容流程,五站統一改採 Curated Blog Automation——先取材真實案例,再套上既有觀點做拆解,AI 的角色從「憑空生成者」轉為「素材組織者」。這套流程已經在另外三個垂直站(aibrand.tw / aimedia.tw / aishop.tw)跑過,實際產出的內容品質明顯更好,因為底層有真材實料可以組織,不是純粹憑空生成。
2. 停用原本綁定這次實驗的兩個排程任務(每日品質審查、每週 BML 週報),避免繼續產出未經驗證的內容。
3. 保留這 103 篇文章在線上,作為這次實驗的歷史存檔——不下架,讓這篇記錄裡的連結持續有效,也讓這段過程本身變成可以查證的公開記錄,而不是事後才說的故事。
這次實驗帶走的一件事:想靠自動化把一件事做好之前,先確保「確認它有沒有做好」這件事本身能被穩定地做到。驗證迴圈不可靠,規則設計得再細,也無法讓系統真正變好。