第62章 、E. 威滕(菲爾茲)
兩個人回到美國以後, 又開始忙碌的學業了。斯坦福采取的是學分畢業制,葉瑄有意用兩年完成本科學業然後在企業做幾年實踐然後再去讀phd,她始終認為計算機應當是一門應用學科, 不能脫離實踐而存在。
雖然物理距離5000km,時差距離5個小時, 但是兩個人的心卻很近。這個時候陳亦桐和葉瑄當時幫忙做的商業化的在線視頻會議軟件Dayin就發揮了作用。平時沒有課在圖書館自習的時候, 兩個人就會通過視頻在線會議軟件陪伴彼此, 偶爾陳亦桐碰到的問題,葉瑄會給出自己的思路, 葉瑄碰到的問題,陳亦桐也能給出自己的見解。
在線視頻軟件Dayin的爆火更是給葉瑄和陳亦桐帶來了第一桶金。随着數字網絡的發展, 現在的人們已經不再滿足于文字的溝通, 而更希望通過信息量更大的視頻對話建立聯系, 而Dayin的出現直接疊代了一些即時的文字通訊軟件,直接占領了辦公、社交、娛樂等需求場景的市場。
僅用了不到一年的時間, Dayin的注冊用戶已經達到了2.3億, 同時最大在線用戶數達到了200萬, 日活躍用戶一千萬,風靡了國內外。并且有不少的新型企業向Dayin發出訂單希望能夠定制企業版客戶端。
2011年11月11日,Dayin在Nasdaq成功上市, 雖然上市前經過多輪融資已經稀釋了陳亦桐和葉瑄手裏的股份, 但是葉瑄手裏依舊有2.6%的Dayin原始股份,加上陳亦桐手裏的1.3%的股份, 兩個人持有約4%的股份。按照當時的市值股價換算,兩個人持有的股票市值約為7.8億美元, 在6個月的限售期之後, 他們可以直接實現財富自由。
這筆在任何人看來都足夠誘人的財富在這兩個剛剛成年的大學生眼裏也不過是如此。因為兩個人清晰的知道, 以他們兩個目前的技術積累再加上葉瑄的“遠見卓識”,財富對于他們兩個來說只是沒有意義的數字。
兩個人也非常的默契沒有把這筆錢的存在告訴雙方家長,葉瑄也曾和陳亦桐商讨過這筆錢的安排。不過陳亦桐對于錢的态度竟然是一如兩世的不在乎,把他的股權全權授予給了葉瑄。他知道葉瑄有在本科畢業之後進行創業的打算,這筆錢剛好支持她的創業,完成她的夢想。
但是葉瑄并不認可這種做法,葉瑄認為即使是親兄弟也要明算賬,很多情侶都因為錢的原因分道揚镳,更有很多夫妻初創企業因為争奪控制權鬧得一地雞毛。不過這筆錢想要變現,也要等到葉瑄快畢業的時候了,到時候再讨論分配問題也為時不晚。
大二下學期,葉瑄的學業就更忙了,她不僅要把修完幾門壓軸的專業課,還需要同時準備畢業論文。好在她本科期間一直在參與實驗室的工作,數據和成果都有,完成一篇畢業論文只是信手拈來的事情。
為了讓自己的男朋友在自己不在的時候不那麽無聊,葉瑄利用自己和陳亦桐的對話數據編寫了一個對話小機器人lover,這個機器人就是葉瑄的畢業論文的部分成果轉化。
陳亦桐對着lover發送信息,這個程序就會根據葉瑄的語言習慣給出回複,相當于一個簡單的ai交互對話。不過不同的在于,這個ai暫時還沒有很多的學習能力,只能進行日常模式的對話。
12年3月,葉瑄向教務助理提交提前考試申請,只有确保完成了畢業所有學分之後,葉瑄才能申請畢業論文答辯。
葉瑄用出色的成績完成了最後三門專業課的考試,她雖然不是斯坦福歷史上第一位全A畢業生,但是卻是斯坦福歷史上第一位僅用兩年畢業的全A生。
她接下來的任務就只剩下完成自己的畢業答辯,迎接盛大的畢業典禮,然後開始自己一段新的生活。
但是很顯然,不是所有人都會對她的提前畢業表示祝福,受到影響最大的就是勞詩慧了,這意味着她需要重新找一個合作夥伴。
葉瑄雖然只是一個本科生,但是她的研究能力不輸很多研究生,有她在實驗室裏,勞詩慧省去了不少的麻煩。去年也憑借和葉瑄合作的成果,成功留任了斯坦福人工智能實驗室拿到了終生教職。
Advertisement
勞詩慧雖然對葉瑄不打算繼續做研究的決定表示遺憾,但是還是支持她創業的決定,還主動給她介紹了自己以前學校的一些人脈。
勞詩慧:“Wish you sess and my door is always open.”(祝你成功,我的大門永遠為你敞開)
葉瑄這段時間利用陳亦桐和lover的對話數據,又對這個機器人的底層算法程序進行調整,使它更符合人類的對話習慣。
陳亦桐這才知道自己被女朋友當成了ai訓練素材,不過既然是女朋友的要求,那只能完成喽。
不過陳亦桐也從自己的專業角度給女朋友的畢設提出了一點建議:“只用我們兩個的對話樣本來訓練它,應該不可能讓它具備學習能力吧?”
葉瑄:“那當然不可能啊!前期我們已經給它喂了一些開源數據庫,規範性的遍歷了一些基本的對話模式,但是顯然還不夠。它目前只能作為一個聯網智能搜索機器人來看待,所以我想做初步的商用來搜集對話數據再不斷精進這個模型。”
陳亦桐:“我要先向你承認錯誤,前段時間我實在無聊,就撬開了lover的‘腦袋’,看了一下它的原始代碼,你們暫時還是用的卷積神經網絡讓它進行監督性的學習?”
葉瑄點了點頭:“如你所見,我們的基礎數據太少,我連最基本的非監督性學習都很難讓它做到。和你對話的這個小家夥還不能被稱為ai,只是一個程序被設定好的軟件罷了。
陳亦桐安慰葉瑄:“不要灰心,科學家從八十年代開始研究卷積神經網絡,06年提出深度學習的概念,現在的進展也只是收效甚微罷了,起碼你的成果已經可以做到一定程度上的自我學習。”
葉瑄當然沒有灰心,她知道深度學習這塊未來的發展前景有多廣,也知道這塊涉及到的知識有多深,她現在所做的只不過是邁出了非常小的一步。
葉瑄目前心裏已經有了完善的商業計劃,如何利用這個不成熟的雛形應用來撬動更大的市場,再用商業化産品的數據來反哺自己的模型。
看着視頻裏的葉瑄信心滿滿的樣子,電腦這斷的陳亦桐也感受到了非常大的壓力。自家女朋友不僅提前本科畢業,而且已經對未來有了清晰的規劃。
感受到壓力的陳亦桐趕緊着手對手裏的這篇論文進行最後的修改。如果這篇論文再投中,陳亦桐本科期間已經有了三篇SCI一區一作的文章,這些學術成果放在任何一個頂尖大學都可以拿到教職了。
作者有話說:
今天不更了,已經更了一萬六千多字了
1.關于深度學習(我自己也不算很懂)
①深度學習的概念是2006年提出的,簡單而言就是我們通過算法把語言,圖像這些數據進行分解,讓程序去解析樣本數據的內在邏輯和表達層次。一個深度學習的ai是否成功,是要看他學習的樣本數據夠不夠大,女主在這裏為什麽要創業,就是為了商業化之後獲得更多的樣本訓練數據。
②傳統的機器學習可能就是設定好既有的程序,讓機器去提取關鍵數據分析,而深度學習就是一種特征學習方法,把原始數據通過一些簡單的但是非線性的模型轉變成為更高層次的,更加抽象的表達,就是教會程序自己去思考。
2.卷積神經網絡
文中提到的一種算法,卷積神經網絡就是在經典神經網絡的基礎上,在輸入層和全連接層加入了卷積層和池化層。一般用于處理多維數組數據(來源百度百科)。國內大多數研究院所做深度學習還是在用卷積神經網絡的算法,而且我國目前的深度學習技術應該還是缺少護城河的。