愛(ài)閱讀 愛(ài)科技 愛(ài)生活
——記清華大學(xué)第30屆“挑戰(zhàn)杯”一等獎(jiǎng)項(xiàng)目小屏幕設(shè)備PDF閱讀軟件和研發(fā)者張藝慶
研通社記者 時(shí)雪
你可喜歡睡前躺在床上用手機(jī)看上幾頁(yè)電子書(shū)?看書(shū)的時(shí)候你有沒(méi)有覺(jué)得屏幕過(guò)小,縮小了看不清、放大了又需要來(lái)回移動(dòng)顯示內(nèi)容,閱讀起來(lái)很不方便?清華大學(xué)汽車(chē)系大二學(xué)生張藝慶就遇到了這個(gè)問(wèn)題。
張藝慶是個(gè)電子閱讀愛(ài)好者,來(lái)自理工科院系的他喜歡讀雜文、讀歷史,而正是一次不算愉快的閱讀體驗(yàn)讓他萌生了做這個(gè)軟件的念頭。朋友送給他一套關(guān)于中國(guó)歷史的電子書(shū),是PDF版本,很多PDF版本的書(shū)都是直接掃描原書(shū)以圖片的方式顯示,在手機(jī)這樣的小屏幕上閱讀時(shí)需要來(lái)回移動(dòng)圖片,很不方便。張藝慶在讀這套書(shū)的時(shí)候就想,怎樣才能讓文字的顯示匹配手機(jī)屏幕的寬度以方便閱讀呢?于是就有了這個(gè)“小屏幕設(shè)備PDF閱讀的解決方案”。

圖1為該軟件演示頁(yè)面。
圖像識(shí)別技術(shù)是這一研究的核心。張藝慶編寫(xiě)了一個(gè)程序根據(jù)頁(yè)面顯示中的黑白點(diǎn)對(duì)掃描版本的PDF文件進(jìn)行識(shí)別,并可以根據(jù)具體需要對(duì)文字顯示的寬度進(jìn)行重新排版,將一行文字截成幾份,重新排版成多行,這樣每一行的寬度減少了,也就為閱讀提供了方便。“這個(gè)軟件是我一個(gè)人做的,因?yàn)橹坝羞^(guò)圖像識(shí)別這方面研究的基礎(chǔ),所以就運(yùn)用了已有的知識(shí)和技能做出了一個(gè)新作品,而且也想學(xué)以致用”,張藝慶說(shuō)。
設(shè)計(jì)這個(gè)軟件花了張藝慶兩星期時(shí)間,第一星期用來(lái)編寫(xiě)程序,實(shí)現(xiàn)運(yùn)行;第二星期則聽(tīng)取老師和同學(xué)們的意見(jiàn),對(duì)軟件進(jìn)行改進(jìn)。他說(shuō),在程序出來(lái)后有人問(wèn)我,包括我自己也想了很多問(wèn)題,如果頁(yè)面里有圖片怎么辦,如果是彩色圖片呢,原來(lái)的文字排版如果版式多樣,比如有很多分欄怎么辦?針對(duì)這些問(wèn)題,張藝慶又為圖片的處理提供了單獨(dú)的算法,設(shè)計(jì)了更多的處理方式,對(duì)程序進(jìn)行完善和改進(jìn)。
總體上看,這款軟件在功能上具有一些優(yōu)點(diǎn)。比如可以識(shí)別分欄,有邊注等排版較為復(fù)雜的文檔;可以自動(dòng)判定圖像是單通道的黑白圖像還是三通道的RGB彩色圖像,根據(jù)通道數(shù)的不同對(duì)圖像分別進(jìn)行處理;具有較高的轉(zhuǎn)化識(shí)別度,切分準(zhǔn)確;算法的可移植性高,作為一個(gè)通用性的產(chǎn)品,應(yīng)該適用于處理各種不同的書(shū)籍,算法對(duì)于不同種類(lèi)的書(shū)籍都應(yīng)該具有較好的識(shí)別效果,經(jīng)過(guò)測(cè)試,這款軟件可以滿(mǎn)足絕大部分書(shū)籍的轉(zhuǎn)化;同時(shí),識(shí)別速度較快,目前處理一本300頁(yè)的圖書(shū)本軟件一般在3分鐘之內(nèi)可以處理完畢。“其實(shí)真的是一款很簡(jiǎn)單的軟件,但還有很多不成熟的地方,在這個(gè)方案里我面對(duì)的最大困難就是如何讓它更加完善。”談到項(xiàng)目的優(yōu)點(diǎn),張藝慶表現(xiàn)得格外謙虛。

圖2

圖3
圖4
圖2為需要處理的頁(yè)面,圖3圖4為處理后的顯示效果。
對(duì)于這一軟件的具體應(yīng)用和未來(lái),張藝慶也有著自己的暢想,現(xiàn)在這個(gè)軟件還存在一些不足,比如受程序編寫(xiě)所用語(yǔ)言的限制,要實(shí)現(xiàn)在所有電腦上的運(yùn)行有一定難度,運(yùn)行平臺(tái)有一定限制;現(xiàn)在還只能在電腦上將文檔重新編排好然后再導(dǎo)入手機(jī)里閱讀。但事實(shí)上,相對(duì)于成熟的文檔閱讀和處理軟件,這個(gè)小軟件的可替代性也較強(qiáng)。在具體應(yīng)用上他更偏向?qū)⒃撥浖龀梢粋€(gè)APP應(yīng)用或者是閱讀軟件的一項(xiàng)插件。
PDF這種閱讀格式不僅美觀(guān)、格式齊整,而且兼容性高,不管是PPT還是文字、圖片都可以顯示,此外保密性、安全性也高,一般不可更改。因此,不斷提高這種文檔格式的閱讀體驗(yàn)很有必要。“你還記得哈利波特電影里面的報(bào)紙嗎?那種展開(kāi)報(bào)紙,圖片里的人物就會(huì)變成立體的蹦出來(lái)向你講故事的那種?現(xiàn)在技術(shù)很可能讓這種閱讀體驗(yàn)成為現(xiàn)實(shí)。比如你看電子書(shū)上有一張圖片,你點(diǎn)開(kāi)它,它可能不只一張,而是可以一張一張翻閱的圖集;或者文檔上有一個(gè)相應(yīng)人物,你點(diǎn)擊它,它就會(huì)向你介紹相關(guān)內(nèi)容,現(xiàn)在iPad里的一種閱讀格式好像就能做到這種地步了。”張藝慶興致勃勃地談?wù)撟约簩?duì)現(xiàn)在和未來(lái)閱讀體驗(yàn)的想法。“也許我會(huì)組一個(gè)團(tuán)隊(duì),說(shuō)不定能做出一個(gè)像Adobe Reader那樣成熟的閱讀軟件。”
張藝慶對(duì)于科技的喜愛(ài)與“挑戰(zhàn)杯”有著千絲萬(wàn)縷的聯(lián)系,他告訴記者,就是在第29屆“挑戰(zhàn)杯”科技展上,他看見(jiàn)了一件自己很喜歡的作品,作者應(yīng)用巧妙的程序設(shè)計(jì)使得演講者可以通過(guò)激光筆操縱鼠標(biāo)光標(biāo),而不再需要走過(guò)去接觸鼠標(biāo)來(lái)控制光標(biāo),從而改進(jìn)了需要使用幻燈片的演講方式。當(dāng)時(shí)他覺(jué)得這個(gè)設(shè)計(jì)非常神奇并讓他看到了程序設(shè)計(jì)變成真正應(yīng)用的實(shí)例。
興趣是最好的老師。張藝慶說(shuō)這次“挑戰(zhàn)杯”帶給他很大肯定和鼓舞,也帶來(lái)給他成就感和滿(mǎn)足感,讓他更加堅(jiān)定了自己對(duì)計(jì)算機(jī)領(lǐng)域的鐘愛(ài)。這個(gè)92年生的大男孩愛(ài)閱讀,愛(ài)科技,也愛(ài)生活?,F(xiàn)在,他已經(jīng)轉(zhuǎn)去計(jì)算機(jī)系,打算繼續(xù)用自己的科技發(fā)明為大家創(chuàng)造便利,更希望能利用科技去影響世界、實(shí)現(xiàn)自我價(jià)值。
編輯:襄樺 實(shí)習(xí)編輯:冰 冰