课程设计(论文)基于VLDB和SIGMOD论文统计的数据库研究热点预测.doc
《课程设计(论文)基于VLDB和SIGMOD论文统计的数据库研究热点预测.doc》由会员分享,可在线阅读,更多相关《课程设计(论文)基于VLDB和SIGMOD论文统计的数据库研究热点预测.doc(17页珍藏版)》请在三一办公上搜索。
1、基于VLDB和SIGMOD论文统计的数据库研究热点预测(华南理工大学 软件学院,广东 广州 510006)摘要:当今世界上,在数据库领域有几个最具权威性的国际学术会议,比如vldb、sigmod、icde等,它们为各国的数据库研究者、开发者和应用者提供一个讨论和交流的平台,引导和促进数据库学科的发展。我们可以从研究人员在这些会议上发表的论文看出当今数据库技术的热点,发现相关课题的未来的发展趋势。首先,我们分析了vldb和sigmod会议在2008年、2009年和2010年所接受的关于核心数据库技术的论文。我们还引用了Observation on Database Research Trends
2、 via Publication Statistics中对这两个会议从1997年到2006年进行统计的数据。我们把论文归为28个类中,其中的22个类是基于传统的数据库技术提出的,其他6个类是我们在分析的过程中加入的新类别。然后,我们预测了六个新类别将断续走红并成为未来的新热点,这也是本文的一大特色所在。最后,我们分析出最近几年数据库技术热点的变化趋势,并推测出未来数据库技术的发展趋势。关键词:数据库;研究热点;趋势Prediction of database research focus based on statistical data of VLDB and SIGMOD papersZh
3、en Zhen, Lin Yong(School of Software Engineering, South China University of Technology, Guangzhou 510006, China)Abstract: Today, there are several authoritativeinternational academic conferences in the area of database, such as VLDB, SIGMOD, and ICDE. They provide a platform for researchers, develop
4、ers, and users of database from every country to discuss and exchange their minds, guiding and promoting the development of database. We can see the research focus of todays database technology and the trend of related topics in the future from researchers papers published in these conferences. Firs
5、t, We analyzed papers about core database technology, accepted by VLDB and SIGMOD in 2008, 2009 and 2010. We also referred to statistical data from 1997 to 2006 in Observation on Database Research Trends via Publication Statistics. We classified these papers to 28 categories. 22 categories are class
6、ified based on traditional database technology, and the others are new categories we added during the analyzing. And then we predicte these 6 new categories will be more and more porpular and become hot spots in the future, which is the main feature of this paper. Finally, we analyze the trend of da
7、tabase research focus in recent years, and predict the trend in the future.Keywords: database; research focus; trend目录1引言32 介绍33 统计数据及总体分析34 具体分析84.1 传统升温热点84.2 传统稳定热点94.3 传统降温热点114.4 新兴热点134.5 往年热门但现在不热门165 结论17参考文献171引言数据库技术从20世纪60年代中期产生至今,经历了人工与文件管理阶段、层次与网状数据库系统阶段、关系数据库系统阶段和新一代数据库阶段。今天,新的数据库应用领域为
8、数据库的应用开辟了新的天地,在应用中管理方面的新需求也推动数据库技术的研究和发展,以关系数据库为代表的传统数据库已很难胜任新领域的要求。为了支持现代应用,数据库工作者们从各个角度对数据库技术进行研究。由于应用特征及其要求的变化多样,加之数据库工作者的不同立场、观点、策略和方法,从而形成了现代数据库世界百花齐放的景象。我们现在面临一个问题:当前数据库研究的热门是什么以及发展趋势怎么样?为了准确地回答这个问题,仅凭感觉是不行的。为此,我们研究了VLDB和SIGMOD近三年的论文,将它们进行归类,从统计数据出发,来分析当前数据库的研究热点。2 介绍为了更好地将会议论文进行分类,我们从网络资源中找到一
9、些统计数据。这些统计数据是通过把VLDB和SIGMOD从1997年到2006年所有的会议论文分成了22个研究方向,并将每一年的论文按研究方向进行统计后得到的。这些数据准确提供了2006年以前十年的每一年每一方向论文所占的百分比。我们所完成的工作是将VLDB和SIGMOD从2008到2010年的论文按那22个方向和6个新兴方向进行归类统计。为了将每篇论文准确地分到一个研究方向中,我们阅读了每一篇论文的摘要部分。我们所增加的的新方向包括“云(Cloud)”、“概率数据库(Probabilistic database)”,“移动对象(Moving object)”、“GPU与多核(GPU/CPUs)
10、”、“图数据库(Graph database)”、“社交网络(Social network)”。从我们的分析中,我们可以看到一些课题一直是研究热点,比如“查询处理(Query processing)”;而一些几年前的热点却已经不再是热点了,比如“多媒体(Multimedia)”;我们还可以发现几个新兴的热点,虽然所占比例不是很高,但可以看出发展势头不小,比如“云(Cloud)”、“GPU与多核(GPU/CPUs)”。值得注意的是,在所有数据中缺少了2007年的数据分析,这是时间有限所致。而且我们的统计数据是分两部分,2006年之前是引用其他学者的,2008年之后是我们自己分析的。这两部分数据在
11、归类标准和判断尺度上无法保证一致性。这在一定程度上影响预测的准确性。但我们基本是把两部分数据先独立分析,再联合起来分析,尽力减小这种影响。另外我们进行归类的会议论文只包括“reseach session”部分,而未将“industry session”、“tutorial session”、“demo session”等其它部分包括在内。3 统计数据及总体分析表1 VLDB和SIGMOD 19972006,20082010年论文统计表TopicsYear1997199819992000200120022003200420052006200820092010Recent 3-year Total
12、# of papers939310695103111128150150141118116115271Access methods0.11110.09790.10610.11300.10480.05070.08050.08920.05030.03550.00850.00860.00000.01Benchmark, performance tuning0.02080.02100.03790.00870.02420.00000.02870.01880.02010.03550.04240.02590.02610.03Data mining or information retrieval0.10420
13、.20980.08330.15650.11290.08700.05750.07980.09050.04570.00850.04310.03480.03Data model and schema mapping0.04170.03500.05300.00870.00810.00000.03450.02820.05030.03550.03390.02590.00870.02Data Quality /Recovery0.00000.00000.00760.00000.02420.00000.01150.00000.00500.01520.00000.00000.00870.00Data stora
14、ge0.03470.02800.01520.00000.02420.02170.04600.00940.00500.00510.02540.03450.04350.03Data warehousing0.07640.06290.08330.08700.08060.08700.02300.01410.04020.05080.00000.03450.00870.01DBMS architecture0.06250.02800.04550.01740.04030.02900.00000.01880.03520.00000.00850.00860.00870.01Extensibility or sc
15、alability0.01390.02800.00000.01740.00810.01450.00000.01880.00000.01520.00000.02590.00870.01Information Integration0.02780.02100.06060.02610.00000.02170.01150.00000.00500.01520.02540.01720.01740.02Multimedia0.02780.02100.00760.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00Network and
16、distributed environment0.06250.01400.03790.05220.04840.02170.04020.03290.04520.08630.03390.05170.03480.04Query processing0.27080.28670.31820.26960.32260.21010.28160.30050.28140.28930.34750.23280.40000.33Reliability0.01390.00000.01520.00000.00000.00000.00000.00000.00000.01520.00000.00860.00000.00Secu
17、rity or privacy0.00690.00700.00760.00000.00000.05070.02870.03760.03020.04570.05930.07760.06960.07Sensor network0.00000.00000.00000.00000.00000.00000.01150.01880.01010.04060.00000.03450.02610.02Special database (GIS, bio, scientific)0.05560.04200.03030.05220.04030.04350.03450.05160.07040.04060.01690.
18、01720.01740.02statistical database0.00690.02100.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00000.00Stream-based data management0.00000.00700.00760.00870.00000.08700.09200.10800.10050.09640.06780.04310.06090.06Transaction management0.02080.02100.00760.03480.00810.02900.01150.00940.00
19、500.02030.00850.01720.00870.01Web and web services0.04170.04900.04550.10430.06450.07250.06900.04230.03520.03050.01690.05170.03480.03XML0.00000.00000.03030.04350.08870.17390.13790.12210.12060.08120.10170.07760.04350.07Cloud/0.00000.00860.02610.01Probabilistic Databases/0.11860.05170.03480.07Moving ob
20、ject/0.00000.01720.00000.01Gpu / cpus/0.00000.03450.03480.02Graph database/0.06780.04310.02610.05Social network/0.00850.00860.01740.01在表1中,我们新加了6个新的研究方向,它们们于表中的最后六行。表1中的最后一列是将2008到2010年的论文集合在一块进行的统计。图1是我们根据表1中的数据绘制的统计图。图1 19972006,20082010 各类论文统计折线图现在我们对表1和图1进行详细分析,可以看到“查询处理(query processing)”一直受研究者
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课程设计 论文 基于 VLDB SIGMOD 统计 数据库 研究 热点 预测

链接地址:https://www.31ppt.com/p-4068854.html