第14章 ☆、
第十四章敏感數據
陳岳然走了,留下李知泉一個人滿身是傷痕和污穢。李知泉害怕他再次過來發瘋,于是咬咬牙,不洗澡直接去了醫院。
肛腸科特需還是那個油嘴滑舌的醫生。他看到包裹得嚴嚴實實的李知泉,煞有介事地鎖上了診室的門。
等李知泉卸下臉上的遮掩後,醫生大驚失色:“哎呀呀,你這個情況,或許得叫一個多發傷會診。”
“先不要,您能不能先幫我留個證據。”
醫生放下寫病歷的圓珠筆,笑了起來:“你被強上了嗎?”
“嗯。”
“這位病人,你是第一天做Gay嗎?”
“什麽意思?”
“你知不知道,強上男人是定不了□□罪的,你讓我幫你留什麽證據?況且留證據你找警察啊,你找醫生做什麽?”
李知泉有些猶疑,他只是想取個證據,下次陳岳然如果還想強迫他,可以借此威脅陳岳然,從而保護自己。他并沒有真的想把陳岳然送進牢裏。
醫生卻自說自話道:“雖然定不了□□,可以定強制猥亵和故意傷害。不過你這個傷,我說實話啊,我從醫生角度看覺得很重很可憐,但法律上看,也只是輕微傷。不會是你們小兩口玩情趣,鬧別扭吧。”
李知泉愠怒道:“你還沒給我檢查呢。別的事別管了,你病歷上幫我把傷情寫清楚,寫仔細些就行。”
醫生收起嬉皮笑臉的樣子,正色道:“你進去,拿一張紙墊好,趴着,褲子脫下來。”
他一邊檢查一邊廢話連篇:“今天我在新聞裏看到你了。沒想到,在醫院裏還能見到你。你的身邊發生的事情可真狗血啊。”
李知泉趴着還不能反抗。
“你下屬幫你做的工作裏面,一定有不得了的東西吧,不然實在是太反常了。”
忍受着這個醫生的聒噪,李知泉終于看完了病又回到家中。這确實太反常了,寂靜深夜裏,他再次打開了葉曦的電腦。
因為傷口的炎症,李知泉發着低燒。他潦草地服下醫院剛配的消炎藥,用手扶着自己前額,強撐自己去看葉曦的建模文檔。
他一字一句地看工作記錄,一行一行地重跑腳本。
數據來源正常。
建模流程正常。
方法論解釋正常。
腳本重跑正常。
還是一樣的結果。
到底哪裏,是葉曦死前還不忘讓他親自仔細檢查的呢?苦思半晌,李知泉想到唯一沒有拆開看的東西——算法包。
葉曦這個模型調用的是圖分析和孤立森林算法,引用了好幾個現成的開源算法包。
銀行裏的數據分析師,重點是解決業務問題,在開發能力上,也就僅限于調用現有的算法包建模。葉曦雖然工作能力還行,但修改算法包,連李知泉都做不到,也沒必要做。
盡管如此,李知泉還是難以置信地逐一檢查這些算法包。當上處長後,他已經很久不做這種純技術的活了,這些代碼看得他頭暈目眩。
李知泉從淩晨看到了白天,恍惚間,他感到自己的身影,和葉曦曾經加班的背影重疊了。他心頭生出一絲恐懼。
潛意識告訴他,馬上就有答案了。離答案愈近,他愈畏怯。
終于,在一個算法包中,李知泉找到了一串與該算法無關的隐晦邏輯。這段隐晦的邏輯,他理解又調試了多次。
它的功能是——在輸出中,排除客戶287749689。
客戶姓名是敏感數據。為了保證建模的公正,建模人員只能看到脫敏數據。标記姓名的,是一串數字,也就是客戶號。
葉曦的這個可疑客戶識別模型,已經部署在風險排查系統中。模型識別出的犯罪高風險客戶,通過風險排查系統,會自動發到法律合規部的查證人員那裏。只有查證人員能夠看到客戶姓名。
287749689,到底是誰?
李知泉開始查詢葉曦建模過程中的客戶行為數據寬表。冰冷的數字,赫然跳轉在他眼前,他一列一列地審查。
客戶號:287749689
身份證號:XXXXXXXX1136XX,身份證號也是敏感數據,只有其中4位可以看。
——此人出生日,是11日。
性別:1
——此人為男性。
手機號:加密亂碼。
剩下的是紛繁的資金流水數據。
2017年下半年起至今,每季度初5號左右,轉出10500元。
2018年的大部分日子,22:30左右,消費4元。
2020年11月11日,消費1200元。
2022年4月到2023年4月,每月收入5萬元。
2022年7月12日,轉賬支出200元。
李知泉終于明白了,287749689,是他自己!
葉曦牢記住了他的生日,或許也牢記住了他的手機號。
睡在葉曦家客廳的第二天,他們随口提到了房租。10500,是押一付三,也就是李知泉三個月的房租。
22:30,是地鐵停運的時間。李知泉和陳岳然相伴游蕩的那段日子,葉曦或許也有意無意地看着他。
1200元,是李知泉買的白金利爪。葉曦或許早已偷偷發現,李知泉用的球拍上,不是陳岳然纏的手膠。
每月5萬元,是李知泉平生的污點。
7月12日的200元,是慶祝升職的那頓火鍋。當時李知泉只感動于陳岳然終于幫他點了個不辣的鴛鴦鍋,甚至記不得葉曦也在。
李知泉剔除了葉曦藏起來的那段代碼,還原了算法包。他重跑這個模型,輸出了一份高風險客戶清單,有密密麻麻1000多條記錄。
“我,在哪裏?”
李知泉沒有用查詢語句去搜索,他用肉眼看,他在模拟葉曦建模時的情形。
當她跑完模型,一定會掃一眼結果數據集。可是脫敏後的數據,看不到任何能辨別身份的信息。枯燥冰冷,繁瑣無聊。
李知泉無法從茫茫數據中發現自己,葉曦何以在茫茫數據中認出了他?
只有一個答案:對葉曦而言,李知泉不是高風險用戶清單中的一條記錄。李知泉的一舉一動都能牽動她的神經。
她認出他,無需姓名。
原來,他才是她眼中的,敏感數據。