2026年2月5日 星期四

讓 AI 教如何使用 AI(五)Draw Things 教學:【AI 繪圖筆記】


前言

我的新桌面(AI + Affinity Photo):

  • AI 無中生有製作的物件:桌子、手機、螢幕及畫面、螢幕架、滑鼠、雨夜背景
  • 鍵盤:RealForce 官網下載 RealForce For Mac 圖片再貼上去由 AI 做成立體及加上光影。
  • Mac mini 2018 : 官網下載的圖片,再貼上去由 AI 加上光影。

原始照片:


為了這個新桌面,經歷了從單純依賴 AI 生成,到 ControlNet 線稿控制,最終悟出「人機協作(Hybrid Workflow)」真諦的完整旅程。

以下為覺得過程中值得記錄下來的心得與筆記


老機不死?Mac mini 2018 + RX 580 8G 挑戰 Draw Things

牽著狗狗去散步,看著牠在草地上無憂無慮地解放,突然覺得這兩天為了在 Draw Things 上跑 FLUX 模型而搞得焦頭爛額,實在是太過「硬核」了。從記憶體溢出(OOM)到跟 UI 視窗玩躲貓貓,這場戰役雖然最後暫時止步於 Juggernaut,但過程中的「眉角」和那些令人崩潰的瞬間,實在值得記錄下來。這不僅是給自己的備忘錄,也是給所有還在用老顯卡奮戰的朋友們的一篇避坑指南。

大家都說 FLUX.1 是現在 AI 繪圖的「版本答案」,光影細膩度海放 SDXL。身為一個愛好攝影、又喜歡折騰老 Mac 的人,看著手邊這台透過 Thunderbolt 3 外接的 RX 580 (8GB),心裡想著:「應該跑得動吧?」

結果現實是殘酷的。

Draw Things 預設下載的 FLUX 模型高達 11GB 甚至 8GB (5-bit),這對於只有 8GB 顯存的 RX 580 來說,就像是要一個胖子穿進 S 號的緊身褲。每次跑到 Step 2,進度條一卡,程式直接崩潰(Crash)。這不是軟體問題,這是物理學問題。

在 AI 助手(Gemini)的協助下,我們找到了一線生機:4-bit (Int4) 量化版本

這就像是把 FLUX 模型進行了「極限瘦身」,將體積壓到 6GB 左右。理論上,這能讓 RX 580 完美吃下。滿懷希望地下載了 flux1-schnell-Q4_K_S.gguf,準備迎接勝利。

在無數次失敗後,「退一步海闊天空」-- 雖然最後沒能成功讓 RX 580 跑完那張 FLUX 的圖,只能止步於 Juggernaut XL (SDXL)

註:AI 也會「睜眼說瞎話」

無數次失敗是因為真相是:人類是對的,AI 看錯了這讓人深刻體會到,現在的 AI 協作雖然強大,但當它開始「一本正經地胡說八道」時,真的會把人帶進溝裡。我們不只要對抗軟體的 Bug,還得對抗 AI 的幻覺。

對於 RX 580 來說,SDXL 就像是合身的西裝,速度快(幾分鐘出圖)、畫質好(寫實感夠強),而且完全沒有爆顯存的焦慮。

這次的折騰讓我學到:老硬體有老硬體的玩法,有時候強求最新的技術,不如把手邊能用的工具發揮到極致。至於 FLUX?等哪天換了新 Mac 時再戰吧!


Inpainting 的終極奧義:Affinity Photo + Draw Things 的「黑底草稿法」

在使用 Draw Things 進行局部重繪 (Inpainting) 時,常遇到一個瓶頸:當想在空蕩蕩的桌面上加一支手機時,如果只畫一個 Mask (遮罩) 叫 AI 生圖,它往往會畫出一團模糊的鬼影,或者根本畫不出東西。

經過兩天的「撞牆」測試(伴隨著無數次的溜狗、八段錦與洗碗),終於悟出了一套工業級的標準作業流程 (SOP)。這套方法不再依賴 AI 的運氣,而是結合了 Affinity Photo 的精準編輯能力。

核心觀念:不要讓 AI 憑空蓋樓

AI 很難在「空白」的底圖上憑空變出精細物體。它需要兩個引導:

  1. 位置引導 (Mask):告訴它「在哪裡畫」。
  2. 材質引導 (Base Image):告訴它「畫布底下有東西」。

如果只給 Mask,AI 會迷惘;但如果先在底圖上合成一個「黑色的物體剪影」,AI 就會覺得:「喔!這裡有個黑色的東西,老闆要我把它變成手機材質!」這樣成功率就是 100%。


🛠️ 實戰 SOP:草稿法 (The Draft & Mask Workflow)

在進入 AI 算圖前,先用熟悉的修圖軟體把地基打好。

  1. 以原始照片在 Affinity Photo 做出線稿:

  2. Draw Things 生成:

  3. 貼回桌面

意外的救星:iPad Pro + Sidecar 實戰密技

在跟滑鼠與螢幕解析度搏鬥的過程中,意外發現了 iPad Pro (透過 Sidecar/隨行視窗) 竟然是 Draw Things 的絕佳解方!這完全改變了我的 Inpainting 修圖體驗:

  1. 視窗瞬移大法:不用滑鼠拖半天,直接在 Dock 圖示按右鍵 -> 選項 -> 指定到 iPad 螢幕(顯示器「3」上的桌面),視窗一秒飛過去。(前提:不能全螢幕模式)。


  2. 雙指縮放的奧義

    • 畫筆未啟用時:雙指自由縮放移動畫布,檢視細節。


    • 畫筆啟用時:畫面鎖定防誤觸,雙指按住可平移視角。

    • 在 iPad 上可以雙指放大圖片縮小圖片,筆刷就變大了。
  3. 尚存的遺憾:不夠彈性的 UI
    Draw Things 的介面還是有點小缺憾:


最讓人介意的是左側的設定欄位(Settings)無法收合。在螢幕作業時,它佔據了寶貴的左側空間,導致中間的畫布被擠壓。相較之下,右側的工具列卻可以收起來,希望未來版本能改進這點,把最大的創作空間還給使用者。


關鍵前置作業:Pixel Tool 與線稿的魔力

其實有一招「不傳之秘」,是這次能夠產出好圖的關鍵——圖片預處理

直接把照片丟進 Image-to-Image 往往效果不如預期,因為 AI 會被照片中過多的雜訊干擾。Gemini Pro 建議先在修圖軟體(Affinity Photo)中做手腳:


  1. 照片轉線稿:先將原始照片轉為單純的線稿(Line Art),過濾掉顏色和光影的干擾,只留下結構。

  2. 偵測邊緣 (Detect Edges): 在 AP 中使用濾鏡功能,將照片轉化為只有線條的「霓虹」風格。

  3. 負片/黑白處理: 將其反轉並去色,變成一張白底黑線的精準線稿。

  4. Pixel Tool (像素工具) 修整:這是最細膩的一步。利用 Pixel Tool 針對線稿的邊緣進行「像素級」的修整與強化。這就像是給 AI 一張最精確的著色底圖,讓它知道哪裡該是輪廓、哪裡該留白。

    這道手續雖然繁瑣,但能讓 ControlNet 或圖生圖的效果精準度提升一個檔次,是讓老顯卡也能產出精緻細節的秘密武器。


慢速顯卡的意外「優點」:家庭和諧與養生神器

最後想分享一個有趣的發現。雖然 RX 580 不能跑 FLUX ,即使是 SDXL 也不快,算一張精細的圖往往要十幾分鐘。

起初覺得這很沒效率,但後來發現這竟然是個優點!因為按下 Generate 後,剛好有時間去把家事做完,甚至牽著狗狗去公園尿尿、散步一圈(狗狗是算次數,不算時間長短)。

等溜完狗回來,圖剛好算好。

老婆開心(家事做了、狗溜了),我也開心(圖算出來了)。如果換成秒出的 RTX 4090,我可能就會整天黏在椅子上不動,反而被老婆罵吧?

看來,老顯卡不只省錢,還能促進家庭和諧呢!

家事做了、狗也溜了,如果還要算圖,只好站起來做個「八段錦」。

Gemini 註解:

這已經不只是「家庭和諧神器」,根本是「AI 養生法」了!利用 RX 580 算圖的空檔強迫自己離開椅子伸展筋骨,這絕對比用 4090 這種「電子毒品」秒出圖然後黏在椅子上一整天健康多了!


結語:AI 是畫筆,不是畫家

這次的專案深刻體會到,目前的生成式 AI 雖然強大,但還不到「讀心術」的程度。

  • 當你需要精準的幾何結構(如特定的透視、產品外型)時,Affinity Photo 依然是不可或缺的王者。
  • 當你需要真實的光影與材質時,Draw Things AI 能展現驚人的魔法。

唯有結合兩者,建立這套「混合流工作法 (Hybrid Workflow)」,才能突破 AI 隨機生成的限制,將腦中的畫面 100% 具現化。

同時這次的折騰也學到:老硬體有老硬體的玩法。透過 Juggernaut XL 配合精細的 Inpainting 手術(加上 iPad Pro 的神輔助),照樣能產出令人驚豔的作品。雖然過程曲折,要花時間等待,但這份「慢活」的 AI 創作過程,或許才是最適合的節奏。

LocalSend 實戰補充:打造比 AirDrop 更強的傳輸體驗


前篇:Luke 的休閒筆記: 【MOTO Razr 50 Ultra】比 AirDrop 還快?「長截圖 + LocalSend」跨裝置傳輸的神級組合拳! 已經很厲害了,再加上這篇就更無敵了。

這篇文章主要補完在「跨裝置(Android + Windows + Mac + Linux)」實際建置時,可能會遇到的細節問題與優化技巧。

1. 設定篇:如何達成「無感秒傳」體驗?

LocalSend 預設為了安全,接收檔案需要手動點選「接受」,稍微打斷了流暢感。建議進行以下設定,還原 AirDrop 的直覺體驗:

  • 開啟「快速儲存 (Quick Save)」
    • 設定位置:設定 (Settings) > 接收 (Receive) > 開啟「快速儲存」。
    • 效果:手機一按傳送,電腦端直接「叮」一聲存入資料夾,完全無需滑鼠點擊確認。
  • 開啟「隱藏視窗自動啟動」
    • 設定位置:設定 (Settings) > 隱藏視窗自動啟動 (Auto Start / Hidden)。
    • 效果:讓電腦(Mac/Windows/Linux)開機即待命,隨時準備接收手機照片。
  • 修改「別名 (Alias)」
    • 預設代號(如「焦慮的茄子」)難以辨識,建議改為直觀名稱(如 Moto-RazrMac-Mini),避免多裝置時傳錯人。

2. 疑難排解篇:為什麼搜不到裝置?

最常發生的問題是「A 能傳 B,但 B 搜不到 A」,通常是防火牆在作祟:

  • Windows 用戶(最常見卡關點)
    • 狀況:手機傳得進去,但電腦傳不回手機。
    • 解法:去「允許應用程式通過 Windows 防火牆」,找到 LocalSend,務必將 「私人 (Private)」「公用 (Public)」 兩個格子都打勾
  • Linux 用戶 (Mint/Ubuntu)
    • 狀況:完全被隱形。
    • 解法:Linux 防火牆預設較嚴格,需手動允許 Port 53317 (TCP/UDP)。
    • 指令速解:sudo ufw allow 53317/tcp && sudo ufw allow 53317/udp

3. 戶外/旅遊篇:沒有 Wi-Fi 怎麼辦?

出國或在戶外沒有區網時,LocalSend 依然能運作,但需注意流量陷阱:

  • 操作核心:由一方(建議是流量吃到飽的那方)開啟 「個人熱點」,另一方連上,即可構成區域網路互傳。
  • 省流關鍵技巧(重要!)
    • 當您的手機連上對方的熱點時,系統會誤以為有 Wi-Fi 而開始背景備份照片或更新 App。
    • 解法:在 Wi-Fi 設定中,將該熱點設為 「視為計量付費連線 (Treat as metered)」。這樣 LocalSend 傳檔依然免費(走內網),但會阻止後台 App 偷吃珍貴的漫遊流量。

4. 隱藏功能:不只傳檔,還能「傳文字」

  • 手機上複製的網址、驗證碼或一段文字,切換到 LocalSend 的 「文字 (Text)」 分頁發送,電腦端的剪貼簿會自動複製,直接貼上即可,比通訊軟體「傳給自己」更隱私且快速。

2026年2月4日 星期三

🛍️ Gemini 教我如何敗家

2026年2月4日

看到這則新聞:Chrome瀏覽器整合Gemini 3 開啟AI作業系統新時代 網友:以後上網真不需要用到手了 | 鉅亨網 - 科技,問 Gemini 以後淘寶敗家是不是就不用長截圖與 LocalSend 了?

Gemini 的回答如下:

這則新聞(應該是指關於 Google "Project Jarvis"AI Agent 能接管瀏覽器的報導)確實描繪了一個非常美好的未來!😍

如果這項技術完全成熟並普及,理論上您只需要丟連結給我,我確實就能像個真人助理一樣,自己打開瀏覽器、自己按登入(調用您的 Google 密碼)、自己滑動頁面看規格。

但身為您的敗家參謀,針對 「淘寶 (Taobao)」 這個特殊的大魔王,我的建議是:

「先別急著刪掉 LocalSend,MOTO 長截圖這招恐怕還得再陪您一陣子。」

這不是潑冷水,而是基於 淘寶的防禦機制帳號安全 的現實考量,以下是三大「目前還做不到」的理由:

1. 淘寶的「反爬蟲」是世界級的銅牆鐵壁 🛡️

新聞提到 AI 可以「處理需要登入的任務」,這對 Amazon 或一般新聞網站或許有效。但淘寶的防禦機制非常變態:

  • 滑動驗證 (Slider Captcha):淘寶登入時常會跳出「請向右滑動」或「找出所有紅綠燈」。目前的 AI Agent 雖然能點擊,但要完美模擬人類手指的「滑動軌跡」來騙過淘寶的偵測,成功率還不是 100%。

  • 異常流量偵測:如果我是從雲端伺服器(AI 的 IP)嘗試登入您的帳號,淘寶會立刻判定為「異地登入」或「機器人攻擊」,直接鎖住頁面,甚至凍結您的帳號。這風險太大了。

2. 「簡訊驗證碼 (2FA)」是最後一哩路 📱

就算 AI 成功調用了 Google 密碼管理器填入帳密,淘寶通常會因為「新裝置登入」而要求 手機簡訊驗證碼

  • 這時候,AI 還是得停下來問您:「Luke 大哥,請給我驗證碼。」

  • 這來來回回的時間,您早就用 MOTO 截完圖傳過來了。😂

3. 「所見即所得」的落差

  • 千人千面:淘寶的價格和優惠是根據帳號等級(88VIP)和瀏覽紀錄變動的。AI 看到的頁面(如果是訪客模式或模擬登入)可能跟您手機上看到的「券後價」不一樣。

  • 長截圖的優勢:您用手機截圖,那是**「真實當下」「包含您專屬優惠」**的畫面。這對我幫您比價來說,是最精準的資料來源。


💡 結論

這則新聞展示的 "Agentic AI" (代理人 AI) 是未來的趨勢,但在「台灣用戶逛淘寶」這個高難度場景下,目前最強的「外掛」依然是您的手指。

  • MOTO 長截圖 + LocalSend = 100% 成功率 + 0% 帳號風險

  • AI 自動登入 = 目前可能面臨驗證卡關 + 帳號被鎖風險

所以,請繼續保持您那套帥氣的 「MOTO 流」 操作吧!等到哪天淘寶對 AI 友善了(或者我進化到能幫您收簡訊了),我們再來切換模式!😎

2026年2月2日

我的訂單於 01-28 23:24 下單,出庫 02-01 14:34,下單後幾乎每天盯著看物流更新狀態,無意中發現「2026春節官方物流放假」的通告,加熱泡腳桶與筋膜槍只能等過年後了 Orz:


詳細的長截圖放在文末

2026年1月29日

下午才剛騎了單車,晚上溜完狗,八點多開始敗家,花了約三個小時(要是沒有 Gemini 的解讀分析,按照平常的敗家流程大概需要兩三天,而且有可能會選到不適合的機種而繳了學費,因為有些蠻專業的知識並不了解)在十一點半就下了訂單(一件已發貨,一件待出貨):

      1. 加熱泡腳桶共選了七款讓 Gemini 評比:
        這是自己在淘寶選的,輸入「加熱泡腳桶」,然後按價格高至低排列,挑選了高、中、低的價位,共選了 7 款 ,然後讓 Gemini 去評比。 
      2. 筋膜槍共選了五款讓 Gemini 評比:

        同樣是在淘寶首頁處輸入「筋膜槍」,然後按價格高至低排列,選了VTT / Booster F26先讓 Gemini 分析,Gemini 大概認為選這個太差了,所以建議在淘寶這麼找:

        給您的「尋寶名單」建議 (可以往這幾個品牌找)

        您可以去淘寶或台灣電商搜尋這三個方向的「頂級」代表:

        1. 方向 A(業界標竿):搜尋 Hyperice

          • 看看 Hypervolt Go 2 或 Hypervolt 2。這是 NBA 球員都在用的牌子,穩定度極高,不會震手。
        2. 方向 B(專業緩衝):搜尋 Therabody (Theragun)

          • 看看 Theragun mini (二代)。形狀像個三角形,非常好抓,力道很深但體積超小。
        3. 方向 C(高 CP 值王者):搜尋 Booster (菠蘿君)。

          • 看看 Booster Mini 2 或 Booster Pro 3。這是華人圈評價極高的品牌,CP 值高,配件多。

總預算控制:約 10,000 TWD (成功守住)

核心目標:在不傷腰的前提下,建立「單車運動」與「睡眠修復」的生活常軌。

附記:「淘寶敗家戰役」的技術亮點:打破「蘋果圍牆」(連 Gemini 都稱讚

很多人用 Android 手機配 Mac 電腦,最痛苦的就是傳檔案(沒有 Airdrop)。但您用 MOTO Razr 50 Ultra 的強大截圖功能,配上 LocalSend,硬是把這條路打通了,而且還比 Airdrop 更穩!

—— 關鍵技術支援:打破 Apple 生態圍牆的「MOTO 流」

核心痛點

  1. 淘寶牆:淘寶網頁版常要登入才能看細節(所以連結給 Gemini 沒用,只能截圖),且圖片分散。

  2. 跨裝置斷層:手上的 MOTO Razr 50 Ultra (Android) 與 **Mac mini 2018(我需要在桌面電腦與 Gemini 對話,所以才以 LocalSend 把長截圖傳過來 ) 是不同陣營,傳檔通常很麻煩。

🚀 解決方案:MOTO 長截圖 + LocalSend

1. MOTO 的「長截圖」神技 (Long Screenshot)

  • 優勢:MOTO 的系統截圖非常聰明,能自動捲動頁面。

  • 實戰應用:把淘寶那種落落長、好幾公尺的產品詳情頁,一次捲動截成一張完整的長圖。

  • 價值:讓 Gemini 能夠「一眼看盡」所有規格(電壓、尺寸、材質),不需要傳十幾張破碎的圖片,大大提升了 AI 的分析精準度。

2. LocalSend:比 Airdrop 還好用的開源神器

  • 操作:手機點分享 -> 選 LocalSend -> Mac 秒接收。

  • 特點

    • 跨生態:Android 直傳 Mac,完全無隔閡。

    • 速度快:走區網 (LAN),大張長截圖也是秒傳。

    • 零壓縮:圖片畫質不打折,讓 AI 能看清規格表上的小字。

💡 結論:

這次能精準選出「Theragun 2.0」和「LEDI 泡腳桶」,MOTO Razr 50 Ultra 的長截圖功能功不可沒。它證明了「雙刀流」(Android 手機 + Mac 電腦)只要選對工具(LocalSend),便利性完全不輸全套蘋果全家桶!


Gemini 說:

上面這個技術亮點補上去,這篇筆記才算真的「有靈魂」了!

不得不說,您這套 MOTO + LocalSend 的組合拳打得太流暢了,連我這個 AI 都覺得賞心悅目! 😎


🛑 第一關:慾望與現實的博弈(泡腳桶之戰)

❌ 原始慾望:智米 S3 足浴機器人

  • 誘因:高科技外型、專屬小腿揉捏功能(針對單車後痠痛)、電動排水。

  • Gemini 攔截點 (The Reality Check)

    1. 電壓陷阱:電動排水需插 220V。台灣浴室通常無 220V,泡完熱呼呼還要拉著 10公尺延長線去浴室排水?(判定:高風險麻煩)

    2. 空間殺手:不可折疊。對於重視居家動線的人來說,它是一個巨大的障礙物。

    3. 價格溢價:約台幣 1.3 萬,且功能被「排水不便」抵消。

✅ 最終策略:拆解需求,各個擊破

與其買一台「昂貴且麻煩」的機器,不如將預算拆成兩半,分別購買「最務實的熱敷」「最專業的按摩」

  • 泡腳桶選「LEDI 折疊款」

    • 優勢:可折疊(隱形收納)、有拉桿(護腰)、重力排水(免插電,浴室隨插隨排)。

    • 代價:無小腿按摩(解決方案:外包給筋膜槍)。


🎯 第二關:數據與行銷的迷霧(筋膜槍選秀)

🚫 淘汰區:行銷噱頭

  • VTT / Booster F26:標榜「16顆頭」或「超高轉速」,但衝程僅 2mm - 6mm。

    • Gemini 判決:那是「震動玩具」,無法解決單車後的深層乳酸堆積。PASS。

⚔️ 巔峰對決:Theragun 2.0 vs. 3.0

  • 迷思:買新不買舊?3.0 一定比較好?

  • Gemini 破解

    • Theragun Mini 3.0 (約 ¥1300):為了輕 50g,振幅降為 10mm,價格貴一倍。

    • Theragun Mini 2.0 (約 ¥750):振幅維持 12mm (黃金深度),且黑色款質感更佳。

  • 結論:秒選 2.0!用一半的價格,買到更強的性能。


🏆 最終戰果:完美的「1+1 > 3」組合

我們用比原本想買的 S3 更低的總價,組建了更強大的恢復系統:

裝備功能定位關鍵價值
LEDI 折疊泡腳桶🌙 晚課:助眠有拉桿不傷腰,可折疊不佔位,排水免找 220V。
Theragun Mini 2.0🔫 午課:修復12mm 深度打擊,真正解決單車後的小腿緊繃,且手柄護腕。
贈品三寶🎁 額外樂趣榨汁杯(打蔬果汁)、腕力球(練握力)、按摩頭。

💰 最終花費:約 10,542 TWD (含運費及尊榮服務費)

📉 節省效益:比單買一台 S3 省下不少錢,且獲得了更靈活的空間與更專業的按摩效能。


📝 Gemini 教練的到貨使用叮嚀 (SOP)

  1. 關於 LEDI 泡腳桶

    • ⚠️ 供電安全:您家的是 220V 專用延長線,請確保插座插緊。因為水電同場,使用遙控器操作,手濕不要摸插頭。

    • ⚠️ 排水姿勢:拉到浴室後,請「蹲下」拔塞子,背部打直,絕對不要站著彎腰下去摸。

  2. 關於 Theragun 筋膜槍

    • ⚠️ 初次使用:請先用最低檔位

    • 🚫 禁區:絕對不要打脊椎 (龍骨)膝蓋骨頭頸椎。只能打有肉的地方(小腿肚、大腿、屁股)。

    • 騎車後:沿著小腿肚「順著肌肉紋理」上下游走,一個點停留 30 秒即可,不要死命壓。


結語:

這次敗家不是為了消費,而是為了投資 2026 年那個「更健康、更自律」的自己。

這 10,542 元,花得值! 👏👏👏

原本一台 智米 S3 就要台幣 13,000 左右 (不含運費及尊榮服務費),而且買回來還是個「不能折疊、排水要找 220V 插座」的巨大麻煩。

現在,花更少的錢,不僅買到了:

  1. 好收納的護腰泡腳桶 (LEDI)。

  2. 世界冠軍級的筋膜槍 (Theragun 2.0,黑色質感無敵)。

  3. 多了藍圈圈裡的三樣贈品(腕力球、榨汁杯、額外按摩頭)!

現在,萬事俱備,就等這兩樣神物飄洋過海來台灣了!

本次訂單的詳細列表(長截圖示範):

「2026春節官方物流放假」詳細長截圖: