1、科技项目申报
3、专利代理
4、安徽新产品鉴定
5、可研报告编制
9、国家火炬计划
按照国家科学技术奖励工作办公室要求,现对安徽省2019年度提名国家科技奖励的7个项目进行公示。
公示时间为2019年1月14日至2019年1月20日,为期7天。
公示期内,任何单位或者个人如对公示项目的真实性和内容有异议,可以书面方式提出并提供必要的证明文件及联系方式。个人提出异议的应表明真实身份,单位提出的应加盖公章。匿名异议和超出期限的异议不予受理。
(一)项目名称
大数据挖掘的若干模型和方法
(二)提名意见
该项目对大数据挖掘的若干模型和方法开展了深入研究,解决了大数据挖掘若干科学问题,例如,系统性地阐明大数据的基本特征,提出了大数据多层次处理框架;设计稀疏嵌入与最小方差下的哈希方法,有效解决训练数据集具有海量特征和高维特征的问题;发明了含缺失值的决策树分类子,可以直接有效地利用缺失数据。
研究成果发表在TKDE、TIP和PAMI等权威杂志,在国内外产生一定的学术影响,被同行引用2600多次、SCI引用1100多次,获得了学术界和工业界的跟进发展和采用,推动了本学科及相关学科的发展。
项目材料填写规范,内容真实,经公示无异议。对照国家自然科学奖授奖条件,提名该项目为国家自然科学奖二等奖。
(三)项目简介
图灵奖获得者斯通布雷克教授认为,大数据的四种含义之一是大多样性,意指:处理来自太多源的数据必然导致令人畏惧的数据集成挑战。数据集成的实质性困难在于多源数据的海量、异质异构和低质量性,这也一直是数据库领域的基础性关键研究问题。该项目组在过十来年对大数据的上述挑战中海量、高维、动态和低质量等问题展开深入研究,揭示了大数据中模式的形态与演变态势,提出训练样本的分块挖掘方法、噪音数据和缺失数据利用模型,从而,在2013年阐明了大数据的四个基本特征:异构、自治、复杂和演化,凝练出HACE定理。主要科学发现点如下:
1、大数据的基本特征与挖掘框架:阐明大数据的基本特征,提出了大数据多层处理框架,为大数据分析提供了理论基础和应用框架;提出稀疏嵌入与最小方差下的哈希方法,用于处理海量特征和高维特征的训练数据集。
2、不完全动态大数据的模式发现:揭示大数据中模式的形态与演变态势,提出面向大数据的不完全信息下模式发现、动态模式发现和模式演变的模型与方法。
3、噪音以及缺失数据的模式质量:揭示噪音数据的可修正机制及缺失数据与已知数据之间的关联关系,提出误差感知下的贝叶斯分类器用于解决噪声数据清洗所带来的信息丢失和信息错误的问题。
卧涛首页 | 关于卧涛 | 高企认定 | 专利代理 | 科技项目申报 | 成果转化 | 通知公告 | 行业资讯 | 解疑答惑 | 联系卧涛 |