當前位置: 半夏小說 玄幻奇幻 重生學神有系統 第396章 商用級手寫識別演算法

《重生學神有系統》第396章 商用級手寫識別演算法

有圖科技是一家份制公司,專業生產各種掃描儀。

該公司出品的「宏圖」系列學掃描儀,在國市場的佔有率,一向超過60%。

之所以賣得這麼好,跟他們自主研發的「宏圖OCR」,關係不可謂不大。

研發部中,一場工作會議正在進行。

「王工,咱們的新版OCR,還得多久能投市場?」

說話的是藍戰新,他今年不過40歲左右,卻已在部長的位置上,穩坐了10餘年。

王仁見部長點到自己,連忙回答說:「最多一個星期。」

藍戰新點了點頭,看起來對這個答案比較滿意。

他想了想,又問:「和上一版相比,能提升的幅度多大?」

「3%以上。」王仁回答。

「這麼高?」藍部長有些意外。

王仁出自信地微笑:「對比較乾淨的中文版面,理想況下,識別正確率可超過92.8%,達到了國際先進水準。」

藍戰新眼神一亮:「太好了!這樣一來,咱們的掃描儀產品,在國的市場佔有率,一定能進一步擴大。」

王工「謙遜」地一笑,搖了搖頭:「不是我們厲害,是對手不夠能打。」

藍戰新笑了起來:「這話有點道理。有句話怎麼說來著,全靠同行襯托?」

其餘人也陪著他一起笑了起來。

沒錯,一直以來,市場上的其他中文OCR產品,識別正確率基本在85%到90%之間波

宏圖OCR已經是其中的佼佼者。

然而,他們萬萬料想不到,一個打破行業規則的強大OCR,即將出世……

※※※

虛擬空間里。

江寒花費了上百個小時,一共學完了三本書:《電力學》、《量子力學I》、《熱力學和統計理》。

他的邊,也積攢了厚厚一摞空白圖紙。

Advertisement

當然,現在這些圖紙已經不空了,寫滿了各種算式和習題解答。

以江寒現在的學習速度,20~30小時一本書,一點力也沒有。

關鍵是,即使連續用腦上百小時,他仍然沒有到一倦意。

剛得到系統的時候,高強度學習、工作4~5個小時,也就差不多到極限了。

而自從學力等級提升到「學者9星」之後,他就沒發現自己力不夠用過……

雖然消耗的冰島紅極參更多了,可是和帶來的好相比,那點金錢上的支出,完全是微不足道的。

江寒非常好奇,不知道自己現在,到底能連續學習多長時間?

於是接下來,他就毫不停頓地繼續啃書、做習題。

又是上百個小時過去,《粒子理與核理導論》、《量子理II》、《等離子理》也全學完了。

而他邊的空白圖紙,也從10CM左右的高度,增長到了18CM以上。

江寒終於有了一倦意,但覺還能撐住,於是毫不停留地繼續學習。

《固理》、《高等學》、《生理》、《流力學》……

一個個txt文件學完,然後連同配套的小圖片集,一起挪到了「已學」文件夾中。

不知過了多久。

江寒學完了最後一個txt文件后,愕然發現,「理學」文件夾已經空了。

這意味著,他一晚之間,學完了大學理學專業,本科階段的大半專業課。

當然,只是理論方面,至於實驗,還一個也沒有做……

直到這時,江寒才覺到了深深地疲倦,連忙退出了虛擬空間。

看了眼學科經驗值面板。

理學的進度條,只差不到15,就能升到高級了。

江寒忍不住咧一笑。

這還不到三個小時,自己就搞定了十來本理專業本科教材。

Advertisement

沒啥意外的話,再有個把星期,理、化學、生三科,都能達到高級水準。

這種學習效率……

「嗯……搞不好,這才是虛擬空間的正確打開方式?」

江寒在心裡嘟囔了一句,隨後就昏睡了過去。

第二天醒來,他仍神不夠飽滿,注意力有點無法集中。

於是思考了一下后,起、穿、下樓。

廚房裡,夏如虹正忙著做早餐。

江寒笑著問候了一聲「早安」,隨後說:「阿姨,給我多加幾個紅極參吧。」

「沒問題!」

夏如虹笑呵呵地答應了,一副心不錯的樣子。

吃完飯,夏如虹出門上班,夏雨菲繼續作曲。

江寒出門溜達了一圈,散心為主,順便思考一下接下來的計劃。

半小時后,他回到了別墅中,就打開筆記本電腦,開始開發新

中文OCR都已經弄出來了,不妨稍微改進一下,再做一款能過得去的「商用型中文手寫識別」。

這個世界上以前並沒有神經網路,但這並不意味著,就沒有手寫識別和語音識別了。

條條大路通羅馬。

在機學習領域,實現同樣的功能,有許多方案可以選擇。

只是這些替代方案,要麼正確率不夠高,要麼需要強大的算力支持……

目前為止,在商業領域還沒有足夠高明的手寫識別演算法。

而這,正是江寒的機會。

老實講,再過半個月,等他那兩篇關於CNN的論文傳播開來……

人工神經網路在圖像識別領域的能優勢,一定會被有識之士注意到。

到時候,幾乎可以肯定,會掀起一場技更新的盛宴。

不出意外的話,各種各樣使用了CNN的應用,會如雨後春筍般出現。

其中絕對不了各種手寫識別

這樣一來,要想在中文手寫識別項目上賺到錢,就必須抓時間了……

Advertisement

用於中文手寫識別的CNN網路,和OCR神經網路相比,在架構上極其相似。

江寒很快就把核心代碼弄了出來,只在一些細節上,進行了微不足道的調整。

然而,最大的問題是缺訓練數據。

中文手寫識別的素材庫,基本上都攥在各大手機廠商,以及一些公司、研究所手裡。

免費使用是本不可能的,就算肯花錢,只怕那些廠商和行業大佬,也不會很容易鬆口。

江寒想了想,決定聯繫一下自己未來的導師。

張德昭人在科大,說不定能聯絡上訊飛公司。

手機里常見的訊飛輸法,就是訊飛公司研發的。

江寒手機里就有訊飛輸法,他重生之後,也試用過幾次。

可惜的是,這時候的訊飛輸法,能著實有點普通,語音輸還算可以,手寫技遠遠算不上

就算這樣,訊飛輸法在國外,已經算得上頂尖水準了。

事實上,在這個世界,大多數手寫識別輸法,表現都很難讓人滿意。

不難猜想,很可能是缺了人工神經網路技,才導致了這種況發生……

手寫中文素材庫這種東西,別的地方不好找,訊飛公司一定有。

而且這個時候的訊飛,還不是一家份制公司。

這樣更好,談起易來更加方便……

江寒拿出手機,給張德昭撥打了過去。

老張接起電話:「喂?」

江寒:「張教授,我是江寒。」

張德昭笑了起來:「是不是想好了,打算提前來上預科?」

江寒微微一笑:「那倒不是,我這次找您,是有別的事。」

張德昭脾氣很好:「只要不是你改主意不來了,那就有的商量。」

江寒呵呵一笑:「您老對我有點缺信心了,說好的事,哪那麼容易變卦?」

老張鬆了口氣:「那就好……什麼事?說吧。」

江寒將自己的需求描述了一遍。

「手寫漢字的素材?」

老張思考了一下,說:「據我所知,訊飛那邊的確有一個素材庫,規模好像還不小。」

頓了頓:「只是……」

江寒笑著問:「只是怎麼?」

老張嘆了口氣:「我跟他們的朱總也不是很,空口白話的,很難讓人家把那麼重要的東西分出來。」

江寒微微一笑:「我可不是沖著佔便宜去的,該掏的錢還是會掏的……」

又說:「勞煩您從中撮合一下,不管是有償使用,還是合作開發,我都可以考慮。」

老張考慮了一會兒,一咬牙:「行,我就豁出這張老臉,去當一回說客!」

江寒連忙謝,想了想,又補充說:「當然,如果他們的條件太苛刻,那就算了,我也不想白忙活……」

張德昭哈哈一笑:「這個你就儘管放心吧,我一定盡量把條件談得『合理』一點。」

接下來,老張又詢問了一下江寒的學習況,這才是他最關心的事

江寒挑不那麼聳人聽聞的部分,簡單地彙報了一下。

比如說,「略」地翻完了大學本科階段,所有的信息學、數學,以及「」部分理學教材……

雖然江寒已經盡量輕描淡寫了,但聽在老張的耳朵里,仍稍嫌浮誇了一點。

「多學點數學和理也是好事,但切記貪多嚼不爛,一定要保證學多、會多,在學好信息學的基礎上,再兼顧其他科目……」

對於老張的殷殷叮囑,江寒連聲稱是。

不過,回頭該怎麼學,還得怎麼學。

自己的路,只能自己去走。

放下電話后,江寒繼續完善程序。

本以為這事兒,即使老張親自出馬,一時半會兒的,只怕也談不下來。

誰料,還沒過兩個小時,老張的電話就打了過來。。

猜你喜歡

分享

複製如下連結,分享給好友、附近的人、Facebook的朋友吧!
複製鏈接

問題反饋

反饋類型
正在閱讀: