劉好仃把茶杯往桌上一擱,水紋晃了三晃才停。小李正往係統裡導數據,老張坐在旁邊,手裡捏著張打印出來的圖表,眉頭鬆了半截。
“昨兒那張001,我翻了三遍日誌。”劉好仃開口,“三次運行,兩次報警一次漏,係統記了預警,留了痕,流程走通了。”
小李頭也不抬:“不止那張。從昨天下午一點四十七分起,新規則上線,一共捕獲了十三次識彆分歧,全進了模糊庫。人工複核後,八次確認是高風險,五次是誤擾。”
老張把圖表推過去:“你看這兒,改進前,ai對邊緣裂的漏檢,差不多三成。現在回測七天數據,同樣的圖,漏的隻剩九個點。”
“不是運氣。”小李調出對比圖,“我們補了二百一十七張標注圖,全是帶氣泡、磨砂乾擾的邊緣裂。模型現在見得多,心裡有數了。”
劉好仃湊近屏幕:“以前是看一眼就下結論,現在是猶豫了,反而對了路。”
“猶豫是好事。”小李笑了,“以前它瞎自信,現在知道哪塊兒虛,先喊人。”
老張哼了一聲:“我倒不怕它猶豫,就怕它以後光喊人,自己不動腦。”
“它本來就不該動腦。”劉好仃說,“它乾的是‘篩’,咱們乾的是‘判’。篩子眼細了,活兒才輕。”
小李把兩組數據並排打開。左邊是改進前的測試記錄,紅色警報密密麻麻,像被戳了一排洞的紙;右邊是啟用新規則後的結果,警報少了,但每一條都帶著“已標記”“已歸檔”“已複核”的戳。
“漏檢率從31壓到9,提升明顯。”小李指著曲線,“更關鍵的是,分歧預警率從18漲到44。說明係統對模糊案例更敏感了,風險提前暴露,不是藏起來。”
老張盯著那根上揚的黃線,看了足足半分鐘,才點頭:“這數,站得住。”
“不止數。”劉好仃拉開抽屜,取出一個硬皮本,翻開,“這是我昨天下車間記的。b線今天上午跑了四百塊玻璃,ai自動放行三百一十二塊,剩下八十八塊進了複核區。老張帶人看了一個多小時,最終挑出七塊真問題,全是邊緣微裂,兩塊還帶自爆前兆。”
他合上本子:“零漏。”
老張沒說話,伸手摸了摸顯示器邊框,像是在確認什麼還在原位。
“咱們得寫個東西。”劉好仃說,“不能光靠嘴說穩了。”
小李立刻新建文檔,標題打了一半,又刪掉,重新輸入:“邊緣缺陷識彆優化效果評估報告”。
“第一條寫清楚。”老張說,“不是係統替人做決定,是幫人把眼睛擦亮。”
“記上了。”小李敲字,“‘預警機製不替代人工終審,所有高風險案例須經三人會審確認’。”
劉好仃靠在椅背上:“還得把數據列全。改進前漏檢率、改進後漏檢率、預警觸發頻次、人工修正比例,一條不落。”
“要不要加個備注?”小李問,“說明這些數據基於過去七天137張模糊案例的回測結果,樣本覆蓋典型乾擾場景三類,光照條件四種。”
“加。”劉好仃點頭,“讓人挑不出刺。”
老張忽然起身,走到白板前,拿起筆,在“判定可靠性”那行字下麵,畫了條橫線,寫下:“經驗證,當前方案可防漏、可追溯、可複製。”
他放下筆:“這三條,夠用了。”
小李把報告拉到最後,插入三人電子簽名區。鼠標懸在“保存”按鈕上,回頭問:“真這麼交?”
“不然呢?”劉好仃說,“乾了這麼多天,總不能最後自己不信。”
小李點了保存。文件版本跳成v1.0,時間戳定格在十四點零七分。
“發出去?”小李問。
“先不急。”劉好仃搖頭,“等我們自己再過一遍。數據不能隻看結果,還得看過程。”
小李立刻調出日誌後台。係統記錄顯示,每一張進入模糊庫的圖像,都有完整的操作軌跡:誰觸發、哪次運行出現分歧、置信度變化、最終歸檔路徑。
“你看這張。”劉好仃指著一條記錄,“早上九點十八分,同一張圖連續三次輸入,第一次判裂紋,第二次判劃痕,第三次建議複核。係統沒放行,直接標黃進庫。十分鐘後,老張登錄,確認高危,打標,歸檔。”
“全程七分鐘。”小李說,“比人工全檢快一半。”
“關鍵是,它知道自己拿不準。”劉好仃說,“以前是硬判,現在是認慫。認慫比硬扛靠譜。”
老張忽然笑了:“我帶徒弟那會兒,總說‘看不出就彆瞎說’。現在倒好,教ai學會閉嘴了。”