夏天

副教授

中国人民大学信息资源管理学院副教授。

  • 办公室:信息楼311
  • 联系电话:
  • 邮箱:xiat@ruc.edu.cn
  • 个人简历

    男,博士。中国人民大学信息资源管理学院副教授。已经转换的研究成果包括:基于AKKA的高性能分布式定向采集爬虫、网页正文自动抽取、关键词/关键短语抽取、拼写纠错、数据资源的数字指纹生成与检测、相似度计算、情感分析、舆情监测、基于维基的语义分析和图谱构建、基于Spark的轨道交通大数据分析、政府网站内容检测分析等。

  • 讲授课程

    信息检索,硕士,2014-至今

    操作系统,本科,2009-至今

    数据结构,本科,2013-至今


  • 学术成果

    论文:

    1) Xiaozhong Liu, Tian Xia, Yingying Yu, Chun Guo, Yizhou Sun. Cross Social Media Recommendation, ICWSM-­16, 2016.

    2) 2016, 夏天, 基于维基百科的中文文本层次路径生成研究,现代图书情报技术,2016, 32 (3): 25-32.

    3) 2016, 张宁,夏天,王皓,黄蕊,陈扬,柳增寿,王烨. 2015年我国省级档案网站建设测评项目综述[J],中国档案,2016,(1): 36-39.

    4) 2016, Tian Xia, Miao Chen, Xiaozhong Liu. Twibo: Comparing Very Large Communities via Massive Social Media Datasets. iConference 2016.

    5) 2014, Tian Xia, Miao Chen, Xiaozhong Liu, Explicit Semantic Path Mining via Wikipedia Knowledge Tree, Proceedings of the American Society for Information Science and Technology, 2014, 51(1): 1-4.

    6) 2014, Xin Shuai, Xiaozhong Liu, Tian Xia, Yuqing Wu, Chun Guo. Comparing the Pulses of Categorical Hot Events in Twitter and Weibo, Proceedings of the 25th ACM conference on Hypertext and social media. 2014, Santiago, Chile, pp.126-135. 7) 2014, 夏天, 陈杰, 魏小贞, 魏书莉, 丁天星. 中国政府网站移动浏览器兼容性研究. 现代情报,2014,34(11): 62-69.

    8) 2014, 顾益军, 解易, 夏天. 基于内容代表性评价的关键帧抽取. 计算机科学, 2014, 41(8): 286-288. 9) 2014, 顾益军, 夏天. 融合LDA与TextRank的关键词抽取研究. 现代图书情报技术, 2014, 30(7): 41 -- 47.

    10) 2013, 夏天. 词语位置加权TextRank的关键词抽取研究. 现代图书情报技术, 2013, 29(9): 30-34.

    11) 2012, 夏天. 中心网页中主题网页链接的自动抽取. 山东大学学报(理学版), 2012, 47(5):25-31.

    12) 2011, 夏天. Web数据的深度定向采集. 山东大学学报(理学版),2011,46(5):34-38.

    13) 2011, 夏天. 基于扩展标记树的网页正文抽取. 广西师范大学学报(自然科学版), 2011, 29(1): 133-137.

    14) 2010, 罗威丽, 夏天, 顾益军. 一种新的电子数据鉴定工具功能交叉划分法. 中国人民公安大学学报(自然科学版) , 2010, 63(1): 67-70.

    15) 2010, 夏天. Ajax站点数据采集研究综述. 现代图书情报技术, 2010, 26(3): 52-57.

    16) 2010, 夏天. Nutch的插件机制分析. 广西师范大学学报(自然科学版), 2010, 28(1): 105-108.

    17) 2009, Tian Xia. Extracting Structured Data from Ajax Site, 2009 International IEEE Workshop on Database Technology and Applications(DBTA2009), 2009-4-25, Wuhan, China, pp. 259-262.

    18) 2009, Tian Xia. Generating Multi-page Mirror Site from Ajax Interfaces, Journal of ICS, 2009-06 6(2):985-992.

    19) 2008, 夏天. 我国档案网站Web标准化现状分析. 档案学通讯. 2008,5:12-15.

    20) 2008, Tian Xia. Extracting Multi-Records from Web Pages, 4th International Conference on Semantics, Knowledge and Grid (SKG2008), 2008-12-3, Beijing, China, pp. 396-399. (EI)

    21) 2008, An Edit Distance Algorithm with Block Swap. The 9th International Conference for Young Computer Scientists(ICYCS2008), 2008-11-18, Zhangjiajie, China., pp. 54-59. (EI)

    22) 2008, Tian Xia. Large-Scale SMS Messages Mining Based on Map-Reduce. 2008 International Symposium on Computational Intelligence and Design(ISCID2008), 2008-10-17, Wuhan, China. 7-12.(ISTP,EI)

    23) 2008, Shinlges-Based Structural Clustering of Web Documents. Journal of Computational Information Systems, 2008,4(4):1721-1729. (EI)

    24) 2008, Tian XIA. A Shingles Approach to Web Document Structural Similarity Computation. International Conference on Information Technology & Environmental System Sciences 2008, 2008-05-15, Jiaozuo, P685-691 (ISTP)

    25) 2008, Kang CHEN,Xiao-zhong FAN,Jie LIU,Tian XIA. Study on FAQ oriented Question Answering system. Journal of Computational Information Systems. 2008,4(2), 2008-02.

    26) 2007, 夏天. 汉语词语语义相似度计算研究. 计算机工程,2007,33(6):191-194.

    27) 2006, 夏天. J2EE应用服务器兼容研究. 计算机工程,2006,32(2):65-67.

    图书:

    1) 夏天. XML原理与应用[M]. 北京:机械工业出版社. 2015-1.

    2) 夏天. 中文信息相似度计算理论与方法[M]. 郑州: 河南科学技术出版社. 2009-12.

    3) 张美芳等. 数字信息保存[M]. 中国人民大学出版社,2016-1.