Sunrise

深圳日記|師傅領進門,修行靠個人

2019年03月08日 00:00:00

一、關于鵬城實驗室

       鵬城實驗室以服務國家和區域發展戰略為己任,聚合國內外優質創新資源,建設重大科學基礎設施和平臺,開展區域性、多領域、跨學科、大協同的基礎研究和應用基礎研究,重點布局網絡通信、人工智能和網絡空間安全等研究方向,努力引領未來學術方向,推動網絡信息產業發展,積極推動粵港澳大灣區打造國際科技創新中心。

 

二、實習項目介紹

       項目名稱:基于動態累加器的去中心化加密搜索方案。

       近年來區塊鏈技術取得廣泛關注,涌現出眾多基于區塊鏈技術的新型應用,其中以StorJ、Filecoin為代表的去中心化存儲應用取得了較好的市場反響。

       對比傳統中心化存儲,去中心化存儲為用戶提供了全新的數據存儲思路,令用戶在獲得更好的服務伸縮性的同時,有效降低數據存儲的成本。但在現有的去中心化存儲方案中,用戶的隱私不能得到有效保護。

       基于此況,引入了一種利用加密搜索技術對去中心化存儲方案進行加強的方法。其基本原理是通過關鍵詞搜索,對關鍵詞信息、文件信息進行加密達到保護隱私的目的。

 

       項目主要目標:

       ①保護用戶隱私的安全去中心化數據存儲:將加密搜索技術運用于去中心化存儲中,在保障存儲數據安全的同時保護用戶隱私。

       ②改善加密搜索效率:引入動態累加器到加密搜索方案中,將搜索令牌(Token)比對次數由O(n)=m·n次降低到O(n)=m次(m為文件數,n為每個文件擁有的平均搜索關鍵字數)。

 

三、工作(學習)內容

       第一周:幫助老師搭建Hadoop集群,后與老師進行詳細溝通并按照興趣選擇了信息安全方向。隨后老師提出讓我跟著目前正在做的可加密搜索項目。

       第二周:學習了數論基礎的前四章,包括自然數的性質、整除性及素數、帶余除法、中國剩余定理等;查找并大致瀏覽了基于身份加密的相關論文,了解其提出的背景、解決的問題以及基礎的體系。

       第三周:這周主要是閱讀論文,完成了李穎的《可搜索加密研究進展綜述》以及Mihir Bellare等的《deterministic and efficiently searchable encryption》的閱讀。

       第四周:完成《Searchable Encryption with Secure and Efficient Updates》以及張琰老師的《基于動態累加器的去中心化加密搜索方案》的閱讀。

       第五周:大概瀏覽了兩篇動態累加器的論文,通過基于強RSA動態累加器的方案,對累加器的概念及用法有一定的了解;整合之前所看過的方案,并抽象出可用于實現的一個小的框架模型。

       第六周:完成了一個可搜索模型的demo。使用的方案是倒排索引,加密算法使用openssl的接口。完成了文件加密、加密文件搜索、文件刪除的操作。同時,也學習了動態累加器的知識。

 

四、一些心得體會與建議

(一)心得體會

       來到實驗室的這一個多月,內心諸多感慨。在環境方面,鵬城實驗室作為一個省級重點實驗室,這種拘謹的情況在見到我的指導老師之后就幾乎沒有了。我的導師是一位年輕的博士生,愛笑。在他帶過的學生里,這一批人的質量是最差的了,他真誠的笑容讓我明白了什么是一視同仁。

       后來認識了更多的老師,才知道他們能夠成為大多數人的老師不是沒有理由的,他們不會因為出身和學歷就否認你,身上也沒有架子,相處起來給人很舒服的感覺。但也正因為如此,身上的壓力反而更大了,因為沒人想讓導師對自己失望。

       在這個階段,學習都是要靠自學,老師會給你正確的方向和建設性的建議,剩下的就只能慢慢地去摸索。在來這里之前,我有一些密碼學的基礎,在接觸到可加密搜索時,感受到了很大的難度,這一塊的內容是非常前沿的,想要學會得先把基礎知識學得更透徹。

       這也從側面說明了我在前三年學到的東西仍是不夠多、不夠深,需要在已有的知識框架下去查漏補缺,慢慢彌補基礎缺陷。在以后的學習中,我會跟著老師的指引慢慢地提升自己,相信一定可以做得更好。

       實驗室的導師經驗豐富,可以給我很好的方向指引;其次是能夠參與到真正的大型前沿項目,對自身的能力、思維都有很大的提高。與此同時,因為導師不可能手把手教我,而我一個本科生去學習這些高端技術,壓力還是非常大的,需要從心理上克服,同時尋找好的方法。

 

(二)一些建議

       教學方面的建議:

       ①教學體系方面得做點研究,這個我切實感受到了其重要性;

       ②這點是對老師的要求,老師得有一些經驗,知道實際應用中主流的技術手段,能給學生一些具有前沿性的指導;

       ③教學的起點要高。如果教學資源足夠,我的想法是選擇一批基礎很扎實的學生,由能力很強的老師帶著做一些前沿性的項目,以自頂向下的方式去學習。建議是2.5+2.5,因為兩年太少,三年又太長,可以的話考慮折中一下。

 

       學習方面的建議:

       自學能力,重要的是自己的努力。

 

五、參與的一些活動

(一)Efficient Privacy-Preserving Data Merging and Skyline Computation over Multi-Source Encrypted Data.

       陸榮幸教授的《基于多源加密數據的高效隱私保護數據融合與天際線計算》主要研究在進行天際線計算時,如何保證數據的秘密性和計算的高效性。針對這些問題,陸榮幸教授提出了使用左偏樹技術作為切入點。介紹根據維度生成數據列表、生成左偏樹、加密左偏樹、數據剪枝等過程,同時針對加密步驟提出了密鑰分解,進行非交互比較的方案。

 

(二)圖與網絡挖掘:我的十五年總結

       裴健教授從建立圖數據庫索引開始逐步進入這個領域后研究了圖構造、圖數據庫(如地理網絡和社交網絡等的專門圖數據庫)、圖查詢、圖模式挖掘、信息流與影響傳播分析、社交網絡隱私保護、圖數據分類和聚類、網絡表示等一系列問題。

 

(三)淺談互聯網廣告技術

       王清泉老師主要介紹了互聯網廣告的發展史以及廣告競價模型、廣告基本技術、點擊率預測模型的演進等方面。他的工作主要是廣告匹配算法、市場實時點擊率預測系統和算法,以及自然語言理解組開發知識圖譜、消歧、排序等核心算法。

       報告中王清泉老師提及廣告需求方平臺(DSP)的整體框架,包括為廣告需求方提供創意優化、預算管理優化、質量預判等服務。同時面對廣告受眾群體借助興趣畫像、人群畫像、購買行為追蹤、實時海量數據分析等信息與技術,來精確投放廣告。

       最后王清泉老師也向我們談及未來廣告的發展,可能會隨著網絡通信時代的更新換代轉向全設備、全平臺、多形式的方向。

 

(四)網絡安全學科專業建設與學科競賽建設

       封化民教授分析了國家網絡安全人才需求和培養現狀,指出目前高校網絡安全人才培養數量和質量與社會需求存在明顯差距、網絡安全類學科建設亟待規范等問題。

       隨后封化民教授結合多年指導全國大學生信息安全競賽的經歷,從賽制規范、組織形式、作品賽要求、創新實踐賽能力評價標準、競賽內容等方面總體介紹了指導制定的《全國大學生信息安全競賽章程》相關內容。

關鍵字:第二屆 青干班 深圳 感悟