成帥似乎還在說著什麼,嘴唇翻動。
唐念一句話都沒聽見。
她咬了下唇,手指蜷縮著,無意識地說道:“對不起。”
她不知道自己為什麼道歉,隻是想用這種方式趕緊結束眼下的情景。她心裡好煩,腦袋也痛,不想再待下去了,可對方卻不依不饒,不準她離開。
陳知禮就是這時候經過樓道的,聽到女生有些顫抖的嗓音,半框眼鏡閃過一道寒光。
她真是好脾氣,一遍遍跟人道歉說自己不是故意的,男生看她性子軟好拿捏,就把所有過錯一股腦歸咎與她,仿佛自己受到了多大的傷害。
陳知禮就這樣站在樓梯口,目光沉沉,看著她低聲下氣給人道歉。
她難道聽不出來這男的是在故意找茬?
也是。
除了對他,她好像對誰都能這麼有禮貌。
一股莫名的火氣直衝雲霄,他冷下臉,點名喊她:“唐念,過來!”
他穿著純黑色定製西裝,站在樓道的暗處,神色藏著看不清晰,但語氣很重,是要發火的前兆。
見她還在猶猶豫豫小聲強調著什麼,陳知禮不耐煩了:“磨蹭什麼,過來!”
唐念轉身跑過來,離近後,陳知禮拉住她胳膊把人往後一拽。抬步走了出去,他比成帥要高半個頭,居高臨下看人時,壓迫感十足。
“陳老板……不不是,陳老師,您回來了。”
在實驗室大家總是私下裡稱導師為“老板”,原因很簡單,到了研究生這個階段已經相當於步入半個社會,我替你發論文評職稱,你讓我畢業,大家各取所需。
這已經算好的師生相處之道,但畢竟這個稱呼太過市儈,正式場合不能喊,眼下陳大魔王很明顯的心情不好,最好不要頂風作案。
陳知禮:“實驗室是讓你騷擾女生的地方?”
成帥:“不是,是誤會,我在跟小師妹開玩笑……”
“玩笑?”陳知禮緩緩掀起眼簾,神色看不清情緒:“你看見她笑了嗎?”
“……”成帥怔了兩秒,立即跟唐念道歉:“對不起,是我腦子不清醒,我給師妹道歉。”
唐念沒出聲,也沒接受他的道歉。
成帥臉色青一塊白一塊的,被女生拒絕已經很丟人了,PUA還被小老板聽見,他真的想死的心都有了。
他張了張口,想給自己辯解幾句,心裡又實在有些怕他,隻沒敢多話。
陳知禮瞥他一眼,離開前“好心”警醒:“再有下次,你自己打包走人,我這裡不歡迎夾帶私欲的人,懂吧?”
“懂懂懂。”
成帥點頭,戰戰兢兢地離開。
寂靜的走廊剩下兩人,沉默的氣氛有點令人發黃。
是他把她叫過來的,唐念還以為他會主動開口說點什麼,哪知陳知禮壓根沒搭理她,轉身就走,留唐念局促地站在原地。
她站著思考了半分鐘,最後還是硬著頭皮跟了過去。
辦公室的門沒關。
唐念敲了敲門,杵在門口罰站。
陳知禮的目光在她身上停了片刻,不帶什麼情緒:“進來。”
唐念挪了個位置繼續罰站。
陳知禮抬了抬下巴,對著桌對麵的電腦說:“查收一下郵件,有服務器密碼,去把數據分類統計一下。”
這是要讓她乾活?
好的。
有事做總比尷尬站著要好。
唐念麻利地走到電腦後,登上自己的郵箱,最新一條未讀郵件來自[email protected].
任務是要她給一堆中醫藥材分類。
唐念根據提示登進服務器,數據是從74萬篇中醫古籍中采集出來的6.5萬種藥材,裡麵有很多彆名、錯名、重複等乾擾項,需要先刪除重複、冗餘或噪聲數據,再人工標注並對數據進行歸類。
唐念以前做過機器學習方麵的比賽,懂得歸類問題的基本步驟,一般先是建立詞彙表,獲取每個詞的embedding,然後使用進行特征提取,最後挑選算法做二分類。
唐念憑借多年工作形成的肌肉記憶,搭建了個算法框架,把6.5萬條數據灌進去,結果出來後拿著對照組驗證準確度。
陳知禮從辦公桌前走出,走到她身後,隻掃一眼得出結論:“過擬合了,重測。”
“……”
唐念隻好刪掉記錄,又重新跑了一遍,陳知禮看一眼,仍不滿意:“我說的重測是讓你換一種算法,不是讓你拿著3000萬美金的GPU在這磨時間,消耗性能,OK?”
“……”
那你一開始說清楚啊!
“還有,你樣本選的有問題,SMOTE得到的增強樣本有誤差,可能已經偏離了原來的語義,大概是文本embedding後距離向量處於高維空間,需要映射到低維再處理。”
唐念沒聽懂,一臉茫然地看著他。
“看我乾什麼,數據增強不會做就去查資料,瞪著一雙大眼隻會喘氣嗎?”
他的火氣太明顯,唐念懂了,他根本就不是讓她來乾活的,尋個理由拿她撒氣罷了,所以無論她做什麼都不可能令他滿意。
“你說話就說話,大聲吼什麼,我怕狗叫!”
她最近根本沒得罪他,上課不遲到,文獻也好好翻譯完了,都不知道他在這發的什麼神經。
當然,犯病是不需要理由的。
陳知禮目光忽然移過來,唐念也看著他,四目相對,誰也不服誰。
唐念是娃娃臉的長相,眼睛圓,皮膚奶白,鼻頭微翹,齊劉海蓋住細長的眉,五官精致得像漫畫裡走出的少女。
此刻她正直勾勾瞪著他,有點奶凶奶凶的。
陳知禮冷淡地回視一眼,眼神嘲諷:“這不是挺會懟嘛。”
“……”
“跟我就能伶牙俐齒,怎麼被彆人欺負的時候嘴皮子就沒這麼溜,隻會點頭哈腰說對不起了。”
“你跟他道的什麼歉,難道就聽不出來他是在故意找你麻煩?”
“你脾氣越好他就越是得寸進尺,這個道理都不懂?”
雖然他這話說的很不中聽,但似乎是在為她謀不平,唐念還真不需要:“不用你管。”
她坐回電腦前繼續工作,把幾個算法梳理一遍,調參重跑,想早點乾完,早點離開是非之地。
“沒人想管你。”
陳知禮也沒心情和她吵,接了個電話。
隨後,把門闔上,下樓去了。
是韓琦教授團隊打來的電話。
這次合作他們負責數據的采集和入庫,以建立大型中醫漢語語料庫。這些數據不僅來源傳統中醫知識,還可能來自網頁數據、數據、各大醫院問診、手寫醫囑等,數據的整理和收集就變得非常繁瑣且複雜。
韓琦教授團隊畢竟隻精通中醫,不懂技術,所以陳知禮這邊會給予技術支持。
“陳老師有時間嗎?”
“你說。”
“我們目前已經把45家中醫院校還有400多家中醫機構的診斷記錄收集起來,目前有個問題是這類資料大多是手寫,字跡潦草,我們很難用掃描識彆的方式轉化為電子版,人工辨彆的話則成本太高,您這邊有沒有好的辦法?”
陳知禮想了想,覺得這事在電話裡一時半會說不清楚:“我下周抽空過去看一下。”
工作人員:“好的,麻煩您了。”
那頭工作人員又嘰嘰咕咕說了一堆遇到的問題,陳知禮說下周統一解決,對麵表達感謝。
掛斷電話,他看了眼手機,想起荀教授那邊還有點事,就順便過去一趟,等處理完回到科研樓已經六點鐘了。
陳知禮摁著太陽穴上樓,推開辦公室的門,看見唐念還在。
夕陽穿透窗玻璃,斜斜落在她身上,落下一道溫暖的弧度。
她趴在電腦桌前,腦袋枕著自己的胳膊,長發散落,像是睡著了。
陳知禮眸光動了動,把空調溫度調高兩度,脫下了外套輕輕蓋在她身上。
唐念動了動眼睫,但沒醒,把腦袋縮的更低了,小小的一團,藏在大衣裡,黑發有些淩亂地壓在臉頰下,隱約壓出一條條的痕跡。
陳知禮定定地看了幾秒,食指指腹勾住發梢幫她順到背後,鬆手後發絲很快又順著肩膀滑下來,遮住了臉頰。
她的頭發保養太好,如絲綢般柔順黑亮,固定不住。
陳知禮視線轉向她的電腦屏幕,黑屏還在不停滾動著日誌,光標閃爍,是她自己跑的 tensorflow計算框架。
TensorFlow是當前人工智能主流開發工具之一,主要工作步驟是生成會話並且在訓練數據上反複運行,傳播優化算法,預測下一個句子出現的的概率。
陳知禮湊近一些,看到她的輸入詞是【問候陳知禮】
看到自己的名字,陳知禮略微訝異。
然後又看到了控製台的一行行預測出的後續詞組:
【陳知禮……你會說話就好好說,不會說話就去跟狗坐一桌,你是在八卦陣上買了一套房嗎?整天陰陽怪氣的,一天到晚就會給人甩臉色,我的眼睛不是染缸,裝不下你的各種臉色……罵你?我就罵你怎麼了,彆說我當麵罵你了,你要是聽不清我還能幫你刻在墓誌銘上……】
“……”