劉好仃早上六點四十就到了車間,比平時早了二十分鐘。他沒去打卡機那兒露臉,直接拐進角落的操作間,工裝外套還沒完全扣好,手裡aready捧著那個磨了邊的u盤。
小李正蹲在舊電腦前換電源線,聽見動靜扭頭:“劉哥,你這比鬨鐘還準。”
“不是我準,是活兒催人。”劉好仃把u盤往桌上一拍,“昨天那五張圖,尤其是最後一張自爆片,得拉出來單練。咱們不能光看它對了一次就樂嗬,得看它能不能次次都對。”
老張端著搪瓷缸子進來,聽見這話,吹了口熱氣:“你這是要給ai搞‘體能測試’?”
“差不多。”劉好仃拉開椅子坐下,“人上崗要體檢,機器上線也得過篩子。咱們現在這套流程——三通道增強、反例歸檔、自動預處理,聽著挺全乎,可它到底穩不穩,得拿真家夥試。”
小李插上u盤,打開文件夾,那張邊緣發暗的報廢圖立刻彈了出來,灰蒙蒙的一片,像蒙了層霧。
“就它當考官?”小李點了點屏幕,“它自己都快看不清,還能考彆人?”
“正因為它難,才要考。”劉好仃指著圖,“產線上哪天不碰上這種拍得糊、光打得偏的?咱們不能光拿標準圖喂它,得讓它學會在泥地裡走路。”
老張把缸子擱在一邊,湊近看:“那你打算怎麼測?”
“三原則。”劉好仃豎起三根手指,“第一,缺陷類型全覆蓋,裂紋、氣泡、雜質、劃痕,一個不落;第二,模擬不同光照條件,高光刺眼、側光拉影、背光藏形,全得試一遍;第三,加點‘人為乾擾’——拍虛了的、手抖的、對焦不準的,也扔進去,看它扛不扛得住。”
小李眨眨眼:“你是想讓它成‘全能選手’?”
“不是想,是必須。”劉好仃打開測試日誌模板,“咱們的目標不是讓它在實驗室裡拿滿分,是讓它在真實車間裡不掉鏈子。”
老張點點頭:“有道理。但你這測試量不小,樣本夠嗎?”
“不夠就造。”劉好仃調出曆史庫,“我昨晚翻了三年內的報廢記錄,挑出四十七張邊緣可疑但標注模糊的圖,全導入‘壓力測試池’。再加上質檢組新拍的五張,湊夠五十二張,夠它忙一上午。”
小李敲著鍵盤建目錄:“要不要分批?一次全上,怕它崩。”
“分三輪。”劉好仃說,“第一輪,純增強圖,看基礎識彆力;第二輪,加模糊、抖動、低對比,看抗乾擾;第三輪,混入易混淆案例,比如氣泡挨著裂紋、雜質藏在反光裡,看它會不會亂點鴛鴦譜。”
老張掏出小本子記下流程,忽然問:“那萬一它中間卡了呢?比如算不動,或者標錯了?”
“卡了就停,錯了就記。”劉好仃點開反例歸檔路徑,“每一輪測試,隻要出問題,立刻截留,打標‘待複核’,回頭一張張拆開看。問題不是終點,是下一次的起點。”
小李啟動第一輪測試,五十二張圖開始排隊加載。屏幕右下角跳出進度條,gpu占用率緩緩爬升。
“開始了。”小李說。
“彆光看結果。”劉好仃盯著日誌窗口,“重點看它怎麼想——中間層輸出、特征激活區域、響應時間,全都記下來。咱們不隻要知道它對不對,還得知道它為什麼這麼判。”
老張看著跳動的數據,嘀咕:“這陣仗,比我們當年考技師還嚴。”
“那當然。”劉好仃笑了笑,“技師錯了,頂多返工;它要是學歪了,整個流程都得重來。”
第一輪測試跑了四十分鐘,結束時識彆率顯示71.3,三張漏判,兩張誤判。
“還行。”小李鬆了口氣。
“不急著下結論。”劉好仃調出那三張漏判圖,“看看它卡在哪兒。”
其中一張是連續微裂,裂紋細得像針尖劃過,分布在玻璃邊緣的應力集中區。模型在三通道增強後,gpu內存瞬間飆到94,響應延遲0.83秒,最終判定失敗。