首页 > 机构概况 > 创新班 > 创新班导师简介

创新班导师 孙乐

孙乐

性别:男

职称:研究员

电子邮件:sunle@iscas.ac.cn

所在部门:基础软件国家工程研究中心

通讯地址:北京中关村南四街4号(北京8718信箱)中国科学院软件研究所

电话号码:无

邮政编码: 100190

研究方向/领域:下一代文本信息检索模型、辅助机器翻译算法、跨语言信息检索、文本分类、汉语语义理解模型等。目前在研课题:国家自然科学基金项目2项,国家863项目2项,国家语委项目1项

1998年博士毕业于南京理工大学

1998年至2000年在中国科学院软件研究所,博士后,从事辅助翻译研究授

2001年1月至2003年2月 中国科学院软件研究所 副研究员 中心副主任

2003年3月至2003年9月 英国Birmingham大学 语料库研究中心访问学者,从事汉英平行语料库研究

2003年10月至2004年11月 中国科学院软件研究所 副研究员 中心副主任

2004年12月至2005年12月 加拿大Montreal大学 计算机系 访问学者,从事高精度和个性化信息检索研究。

2005年12月——至今 中国科学院软件研究所副研究员

中国中文信息学会 秘书长

中文信息学报 副主编

中文信息学会 内容安全与信息检索专委会委员

人工智能学会 自然语言处理专委会委员

ACL (the Association for Computational Linguistics) Member

ACM SIGIR(Special Interest Group on Information Retrieval)Member

2003、2004和2005年863信息检索和文本分类测评的组织者

2008国际测评NTCIR-7MOAT中文简体任务的组织者

国际计算语言学大会(COLING2010)组织委员会主席

在国内外主要刊物和会议上共发表论文50多篇,软件登记5项,软件专利3项,已经培养博士4名,硕士12名。曾获2007年中国科学院软件研究所优秀导师。

[2] Let’s Play Chinese Characters - Mobile Learning Approaches via Culturally

期刊

[1]黄瑞红,孙乐,冯元勇,黄云平,基于核方法的中文实体关系抽取研究,中文信息学报,22(5),pp.102-108,2008

[2] 李文波,孙乐,张大鲲. 基于Labeled-LDA 模型的文本分类新算法. 计算机学报,pp.620-627,31(4),2008

[3] 张永臣,孙乐,等中文信息学报,“基于数据的特定领域双语词典抽取”,中文信息学报,2006,20(2)

[4] 冯元勇,孙乐,张大鲲,李文波. 基于单字提示特征的中文命名实体识别快速算法,中文信息学报,22(1), 2008

[5] 冯元勇,孙乐,董静,李文波. 基于分类信心重排序的中文共指消解研究,中文信息学报,21(6): 22-28. 2007

[6] LIU Qun, WANG Xiangdong,LIU Hong, SUN Le, TANG Sheng, XIONG Deyi, HOU Hongxu, LV Yuanhua, LI Wenbo, LINShouxun, QIAN Yueliang,Introduction to HTRDP evaluations on Chinese information processingand intelligent human- machine interface, Frontiers of Computer Sciences inChina, Vol.1, No.1, Feb.2007

[7] 董静,孙乐,冯元勇,黄瑞红,中文实体关系抽取中的特征选择研究,中文信息学报,2007,21(4):80-85

[8] 张玮,孙乐,冯元勇,李文波,黄瑞红,词汇搭配和用户模型在拼音输入法中的应用,中文信息学报,2007,21(4):105-110

[9] 张大鲲,张炜, 冯元勇,孙乐“基于非连续短语的统计翻译模型研究”,中文信息学报,2007,21(1)

[10] 张俊林,刘洋,孙乐,刘群, “2005年度863 信息检索评测方法研究和实施”, 中文信息学报,2006

[11] 张俊林,孙乐, 孙玉芳“一种改进的基于记忆的自适应汉语语言模型”,中文信息学报,2005,19(1)

[12] 曲为民,张俊林,孙乐,孙玉芳,“Difx:利用动态索引算法实现高效的XML数据查询”,计算机研究与发展,2005 Vol.42 No.11

[13] 曲为民,孙乐,孙玉芳,“XML数据查询中值匹配查询代价估计算法的研究”,软件学报,2005年4月,16(4)

[14].张俊林,孙乐,孙玉芳,“基于主题语言模型的中文信息检索系统研究”,中文信息学报,2005,19(3)

[15].张俊林,曲为民,孙乐,孙玉芳 “一种改善的基于语言模型的中文检索系统研究”, 中文信息学报,2004,18 (2)

[16].曲卫民,张俊林,孙乐,“基于主题的汉语语言模型的研究”,《计算机研究与发展》2003,Vol, 40, No.9, p1368~1374

[17] Qu Wei- min, ZhangJun-lin, Sun Le, Sun Yu- fang, An Efficient Indexing and Querying Algorithm forLarge- scale XML Data, 《软件学报》, 2003,Vol.14, p97~104

[18] 闽金明,孙乐,张俊林,重新审视跨语言信息检索, 中文信息学报, 2006,Vol 20(4)

[19] .曲为民,张俊林,孙乐,孙玉芳,基于记忆的中文自适应语言模型的研究,中文信息学报,2003,Vol 17 (5)

[20] 曲为民,孙乐,孙玉芳,“半结构化中文信息检索中查询结果相关度算法的研究”,中文信息学报,2004,18(4)

[21] 张永臣,孙乐,等中文信息学报,“基于数据的特定领域双语词典抽取”,中文信息学报,2006,20(2)

[1] Dakun Zhang, Le Sun,Wenbo Li, A Structured Prediction Approach forStatistical Machine Translation,IJCNLP'2008(poster),pp. 649-654. Hyderabad,India, 2008

[2] Wenbo Li, Le Sun, etc.Smoothing LDA Model for Text Categorization. 4th AsiaInformation RetrievalSymposium (AIRS'2008),LNCS 4993, pp. 83–94, Harbin,2008

[3] Li Jing, Le Sun, A LexicalChain Approach for Query-focused Update-style Multi-document Summarization,AIRS 2008, LNCS4993, pp.310-320

[4] Li Jing, Le Sun, KitChun Yu, J. Webster, A Query-focused Multi-document Summarizer based on LexicalChains, DUC workshop, 2007

[5] Ruihong Huang, LeSun,Yuanyong Feng, Study of kernel-based Methods for Chinese RelationExtraction, AIRS 2008, LNCS

[6] Yuanyong Feng, RuihongHuang, Le Sun, Two-step Chinese Named Entity Recognition Based on ConditionalRandom Fields, Proceedings of SIGHAN Workshop, 2007

[7] Ruihong Huang, LongxiPan, Le Sun, ISCAS in Opinion Analysis Pilot Task: Experiment with SentimentalDictionary based Classifier and CRF Model, Proceedings of NTCIR WorkshopMeeting, Tokyo, Japan, May, 2007

[8] Yuanhua Lv, Le Sun, etc.An Iterative Implicit Feedback Approach to Personalized Search, Proceeding ofCOLING/ACL2006,Sydney

[9] Yuanyong Feng. Le Sun.Yuanhua Lv, Chinese Word Segmentation and Named Entity Recognition Based onConditional Random Fields Models Proceedings of the Fifth SIGHAN Workshop onChinese Language Processing, 2006,Sydney

[10] Quan Zhou, Le Sun,Yuanhua Lv, ISCAS at DUC06, Proceeding of the Document UnderstandingConferences (DUC) 2006

[11] Jinming Min, Le Sun andJunlin Zhang,ISCAS in English-Chinese CLIR at NTCIR-5, Proceedings of the FifthNTCIR Workshop on Research in Information Access Technologies InformationRetrieval, Question Answering and Summarization, Tokyo Japan, 2005.

[12] Quan Zhou, Le Sun,Jian-Yun Nie, A Multi-Document Summarizer based on Document Index Graphic andLexical Chains, Proceeding of the Document Understanding Conferences (DUC)2005,10

[13] Junlin Zhang, Le Sun,Using the Web Corpus to Translate the Queries in Cross-Lingual InformationRetrieval, 2005 IEEE International Conference on Natural Language Processingand Knowledge Engineering. Oct., 2005

[15] Junlin Zhang, Le Sun,Quan zhou,A Cue-based Hub-Authority Approach for Multi-Document TextSummarization, 2005 IEEE International Conference on Natural LanguageProcessing and Knowledge Engineering. Oct., 2005.

[16] Zhang Junlin, Sun le,Lv Yuanhua,Zhang Wei Relevance Feedback.by Exploring the Different FeedbackSource and Collection Structure Proceeding of the Text REtrieval Conference(TREC).TREC 2005

[17] Sun le, Zhang Junlin,Sun Yufang, ISCAS at TREC2004:HARD Track. Proceeding of the Text REtrievalConference (TREC).TREC 2004

[18] Zhang Junlin, Sun Le ,Qu Weimin, Sun Yufang. A Trigger Language Model-based IR system, The 20thInternational Conference on Computational Linguistics(COLING2004). Geneva,Switzerland, Vol.1, pp. 680-686, Aug, 2004

[19] Zhang Junlin, Sun Le ,Yongchen Zhang, Applying Language Model into IR Task, NTCIR Workshop FourthMeeting,2004.

[20] Zhang JL, Sun Le, QuWM, et al., A three level cache-based adaptive Chinese language model, 1stInternational Joint Conference on Natural Language Processing (IJCNLP 2004),MAR 22-24, 2004

[21] Zeng Wu, Lin Du, LeSun, Shiwei Ye TREC12 HARD Track at ISCAS, Proceeding of the Text REtrievalConference (TREC) TREC 2003

[22] Sun Le, Qu Wei-min, XueSong, Constructing of a Large-Scale Chinese-English Parallel Corpus, InColing2002, The 3rd Workshop on Asian Language Resources and InternationalStandardization, TaiWan, 2002 /p>

[23] Zhang Jun-lin Zhang,Sun Le, Qu Wei-min, DuLin, Xue Song, ISCAS IN NTCIR-3, NTCIR-3, Tokyo, Japan, 2002

[24] Sun Le, Zhang YiBo,Zhang JunLin, Sun YuFang, PECAT: A Computer-Aided Translation Tool Based OnBilingual Corpora, Proceeding of the IEEE SMC 2001, Tucson, Arizona,USA, Oct.7-10, 2001, p927~932

[25] Sun Le, Zhang Junlin,Qu Weiming, Sun Yufang, Evaluation of an English-Chinese CLIR ExperimentalSystem Based on Bilingual Dictionary, International Conference on ChineseComputing, Singapore, Nov. 2001

[26] Zhang Yibo, Sun Le, DuLin, Jin Youbing, Sun Yufang, ISCAS' Text Retrieval in NTCIR Workshop II, Proceedings of theSecond NTCIR Workshop Research in Chinese & Japanese Text Retrieval andText Summarization, Tokyo, Japan, pp.146-153, Mar. 7-9,2001

Daniel Jurafsky & James H. Martin,冯志伟 孙乐 译 《自然语言处理综论》,电子工业出版社, 2005年6月,587页 (SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition)