伯特人力资本管理专家人力资本管理软件-HCM
网站导航

首页 > 课程与训练营 > 培训与训练营 > 大数据与云计算

大数据与云计算

来源:伯特管理咨询公司    发布时间:2016-07-22    浏览次数:

关于大数据培训

行业背景

经济学家杰里米·里夫金提出,互联网技术和可再生能源的结合是第三次工业革命一个特质,它创造了强大的基础设施。的确,在产品经济年代,基础设施是“铁、公、机”,“路、桥、隧”,“水、电、气”。但在数字化年代,还要加上软的基础设施:“大、云、平、移”。

 

“大”就是“大数据”,即通过云计算、移动互联网等手段,从各类数据中快速获得有价值信息的能力。它具有Volumn体量巨大、Variety类型繁多、Value价值低密度、Velocity处理快速的4V特点。“云”就是云计算、云服务。2010年起,上海推出了“云海计划”。“平”就是平台,有交易平台、媒体平台、支付平台、软件平台等。全球品牌500强前十名中有6个是平台型企业;中国500强企业前40名中,利润最丰厚的是平台型企业,如百度、网易、腾讯、阿里巴巴等。“移”就是移动互联网,即互联网加移动通信。近年来,它在国内外成长迅捷。


课程结构框架体系

在参照业界大数据培训框架体系的基础上,结合过往培训工作开展经验,伯特咨询大数据培训的课程框架体系如下:

 

“计算广告学”课程

课程概述

计算广告是广告投放中一个新兴的分支,主要指互联网在线广告的精准投放。计算广告学重点研究:互联网在线广告的商业模式,产业链分工,广告检索算法及平台,广告投放策略及平台等内容。本课程将介绍计算广告学的基本概念、基本方法、技术发展与趋势,以及典型系统。

课程大纲

第一部分

·计算广告学概述:了解计算广告与传统广告的主要区别,互联网在线广告的分类;

·计算广告商业模式:了解计算广告商业模式的发展历程,未来发展趋势,以及目前计算广告的竞价策略;

·计算广告产业链:了解ad network,ad exchange, ad dsp, ssp, 等主要产业链分工及其功能;

·计算广告投放机制:了解展示广告和文本广告的检索方法、检索平台、投放策略和投放平台;

·计算广告学的新兴投放形式:了解移动设备广告投放,视频中广告投放等新兴计算广告形式。

 

第二部分

·计算广告学概述:计算广告学发展历程,计算广告学的分类,商业模式,产业链分工。

·博弈论在计算广告学中的应用:深入了解计算广告学的商业模式,博弈论对设计该商业模式的作用,竞价规则在计算广告学中的应用和扩展;

·信息检索在计算广告学中的应用:信息检索的基本原理,信息在广告检索、排序方面的扩展;掌握广告的基本检索方法;

·文本广告:掌握文本广告的分类及其区别,赞助商搜索的关键词广告检索,查询扩展检索,相关度竞价综合排序策略,网页文本广告的检索,确定投放和非确定投放的综合投放策略;

·展示广告:掌握展示广告的投放形式,展示广告的计价方式,重定向机制等;

·移动广告和视频广告:掌握并理解嵌入了用户位置信息后的移动广告投放策略,理解视频广告投放机理。

 

第三部分

·计算广告概览:计算广告分类,发展历程,商业模式,广告形式等;

·广告检索技术及其系统:掌握文本广告,展示广告的检索技术,及其相关实现平台;

·广告竞价技术及其系统:掌握关键词竞价,展示广告竞价,dsp竞价技术及其相关实现方法;

·广告与推荐:掌握个性化推荐技术在计算广告中的相关应用及其实现;

·广告异常检测技术:广告计费系统,广告异常点击检测系统,

·移动广告技术及其系统:基于位置信息的计算广告商业模式,及其广告投放系统;

 

 

“数据可视化分析”课程

课程概述

信息可视化旨在研究大规模信息资源的视觉呈现和表达。信息可视化为日益显著的“数据超载”问题提供近实时的解,有助于用户解决模型与模式的有效发现问题,还能提供直观的分析结果及解释,是近年来数据分析与管理的热门领域。本课程将介绍数据分析可视化的基本概念、基本方法、技术发展与趋势,以及典型案例。

课程大纲

第一部分

·数据可视化分析概述:了解信息可视化的概念和范畴、发展历史及技术演化;

·介绍可视分析的基本理论,包括视觉基本知识,颜色理论,光学模型等。

·介绍基本的可视化图表,包括柱状图、饼状图、散点图、平行坐标、盒须图等;

·了解信息可视化的最近进展,面向大数据的可视分析新策略。

 

第二部分

·信息可视化概述,包括信息可视化发展历程,信息可视化的分类、特点等;

·介绍可视化研究领域,包括基本可视化数据结构及其应用,如网络数据、多变量数据、时变数据,以及和应用领域相关的数据类型;

·介绍基本的可视化算法,包括等值面提取、感知显示、过程可视化技术等;

·重点介绍经典的数据可视化方法,包括地图可视化、树与网络可视化、文本可视化、社交网络可视化等;

·介绍常用的可视化软件系统,包括Improvise、Polaris、InfoVis 工具包等。

 

第三部分

·信息可视化概述:信息可视化发展历程,信息可视化的分类、特点等;

·高级信息可视化算法:高维数据信息的降维方法、多维信息的可视显示方法;

·过程式可视化技术:如何将机器学习、统计学原理等与图形显示结合起来?

·案例分析:针对典型的信息可视化案例,分析优缺点;

·典型数据的可视分析实践:利用部分数据样本,来进行可视化分析实践,至少完成一种数据可视化方案设计与实现。

 

 

“数据挖掘与机器学习”课程

课程概述

机器学习是在数据上建立计算机模型,从经验中学习知识,并应用于对未来的预测。而数据挖掘是从数据中获得隐藏的模式。信息技术的进步带来数据量的极大增长,机器学习和数据挖掘被广泛用于各类数据处理任务中,是大数据应用的基本方法。

在本课程中,我们将介绍机器学习和数据挖掘的基础理论知识,基本的模型,及其典型应用。

课程大纲

第一部分

·与机器学习相关的概率,统计以及数学等的基础知识

·聚类方法:了解聚类方法的应用和各种模型,Partitional clustering、Hierarchical clustering、Kmeans,以及基于Density 的聚类方法,比如DBSCAN等

·贝叶斯决策理论

·极大似然估计,贝叶斯估计

·分类方法:决策树、朴素贝叶斯、K 邻近法((K Nearest Neighbor, KNN)、Bagging、Boosting

·回归方法:最小二乘回归、逻辑回归

·神经网络

·降维方法:Principal Component Analysis (PCA)、Multidimensional Scanlig (MDS)

 

第二部分

·假设检验:了解并懂得significance test, p-value等模型结果分析概念。

·模型选择:理解各种模型选择的理论

·Sequence labeling 模型: 应用于 part of speech tagging (POS)等任务中。包括隐马尔科夫模型、条件随机场等。

·支持向量机

·最大熵模型

·Topic models 以及相关的语言模型:LSI、PLSI、Latent Dirichlet Allocation (DLA)

·流形学习 (manifold learning)

·Machine learning ranking (MLR)

·网页pairwise ranking

·广告点击率预测

 

 

“分词系统与搜索技术”课程

课程概述

“大数据”已经成为一个时髦的术语,从字面上来看,“大数据”这三个字构词简单,本身没带太多信息,给人们留下很大的解读空间。到底什么是“大数据”?这个概念是如何诞生的?它的内涵和外延是什么?本课程将从数据库学习和研究者的角度来对大数据进行解读,以帮助学员客观全面理解大数据的产生和发展。

课程大纲

·科学的大数据观

- 大数据的定义,科学发展渊源

- 如何科学看待大数据?

- 如何把握大数据,分别从“知著”、“显微”、“晓义”三个层面阐述科学的大数据观

 

·大数据精准搜索关键技术

- 通用搜索引擎与大数据垂直业务的矛盾

- 大数据精准搜索的基本技术

- 大数据精准搜索语法

- 大数据精准搜索应用案例

- 实训演练

- JZSearch大数据精准搜索引擎实训演练

 

·大数据挖掘

- 语义理解基础

- 内容关键语义自动标引与词云自动生成;

- 大数据聚类;

- 大数据分类与信息过滤;

- 大数据去重、自动摘要;

 

·汉语分词关键技术及最新进展及使用实训( NLPIR2014 )

- 汉语分词关键技术及最新进展

- 英语词法分析技术;

- Java语言调用实训

- Linux调用实训

- 高级编程实训

 

 

“社交媒体数据分析及其应用”课程

课程概述

社交媒体是万维网中利用社交网络进行信息传播的一类服务的总称,是典型的新媒体。社交媒体数据的管理与分析是與情分析、客户关系管理、用户画像等应用的基础和支撑技术。本课程将介绍社交媒体数据分析的概念、基本方法、技术发展,以及典型的应用。

课程大纲

第一部分

·社交媒体概述:了解社交网络、Web 2.0、社交媒体数据模型,社交媒体服务的分类;

·社交媒体数据获取:了解社交媒体数据获取的基本方法,并理解各方法的局限性;

·社交媒体内容分析:了解分词、VSM模型等信息检索基本技术;了解开源的信息检索工具;理解社交媒体内容分析与传统信息检索技术的区别;

·社交网络分析:了解网络的基本模型及其表示;了解小世界网络、无标度网络等社交网络模型;理解社交网络的度量及其意义;了解社交网络分析的基本方法;了解并学会开源社交网络分析软件工具(如Gephi)的使用;

·社交媒体数据分析示例:以“网上集群行为分析系统”原型为例,理解所学基本方法的综合利用。

 

第二部分

·社交媒体内容分析:掌握信息抽取和信息检索的基本方法;了解Lucene及其使用;理解中文处理与西文处理的区别;

·社交网络分析:掌握社交网络分析的基本方法;了解关系数据库与图数据库管理社交网络数据的优缺点;掌握RDBMS中使用SQL语言查询社交网络数据的方法以及图数据库(如Neo4J)使用方法;

·时序数据分析:了解时序数据的模型、以及相似性度量;了解时序数据分析的基本方法;

·数据挖掘方法:回顾数据挖掘的基本任务和方法,尝试Mahout等开源海量数据挖掘工具;

·社交媒体数据分析综合应用:了解情感分析、时空分析、事件发现与监测、用户画像、实体检测等基本社交媒体数据分析任务;实践采用学过的方法和系统完成至少一个分析任务。

 

第三部分

·大规模分布式系统回顾:了解以Hadoop、Spark等系统为代表的大数据管理和处理工具;

·信息检索技术:了解信息检索技术的发展现状和可用工具;

·社交网络分析:了解信息社交网络分析的发展现状和可用工具;

·数据挖掘方法:了解信息数据挖掘的发展现状和可用工具;

·社交媒体数据分析应用分析:以集群行为分析、與情分析、个人信息分析、情感分析、社交网络营销、Spam检测等应用为示例,分析相关技术的选取准则、了解应用效果测试方法;

·社交媒体数据分析综合应用:结合学员背景和工作,完成一个社交媒体数据分析相关的应用原型,并进行测试分析。

 

 

“位置服务及其应用”课程

课程概述

位置服务是新时代移动数据管理的一类新兴数据管理方式。在定位技术的帮助之下,可以实时获取移动物体的位置信息,再进行相应的查询、分析、预测、推荐等工作。本课程介绍位置服务的概念、基本方法、技术发展,以及典型的应用。

课程大纲

第一部分

·LBS概述:了解LBS应用背景、基本架构;空间数据库基础知识

·LBS快照查询处理:针对过去数据的查询处理、针对当前数据的查询处理、针对未来的查询处理。

·LBS连续查询处理:连续查询与快照查询的差异、代表性的连续查询处理算法

·移动索引技术:针对移动数据的索引技术、时空索引技术

·开源LBS项目分析:介绍一个开源LBS系统

 

第二部分

·轨迹数据管理(初级):介绍轨迹数据管理概述。轨迹分析技术。

·位置隐私保护技术:概述、位置隐私攻击手段,位置隐私常用防御手段。

·社交媒体与LBS:介绍社交媒体与LBS的管理

·分布式架构与LBS:介绍如何基于分布式架构实现LBS

·基于LBS的模式发现:目的是根据LBS数据发现一些重要模式

 

第三部分

·室内LBS技术:多种定位技术分析、室内LBS技术的建模、索引与查询

·不确定LBS技术:不确定性时空数据的概念、概率LBS查询技术

·轨迹跟踪技术(高级):轨迹预测技术

·基于路网的数据管理:基于路网模型来管理数据。

·高级位置隐私保护技术:基于隐私保护的查询处理技术,包括范围查询、聚集查询、最近邻查询等。

 

 

“数据系统”课程

课程概述

数据系统是数据存储系统、数据处理系统的统称。几十年来,数据系统按照应用类型的不同,可以分成事务处理

系统,数据分析系统,数据流系统,键值对存储系统,对规模并行数据处理系统等。本课程将介绍数据系统基本概念

、基本算法、典型系统,技术发展与趋势等。

课程大纲

第一部分

·数据系统概述:了解数据系统40年来的发展历程,数据系统的主要分类;

·事务处理系统:了解事务处理的基本概念,事务系统基本算法,典型事务系统包括Oracle,DB2, SQL Server, MySQL等系统的使用;

·数据分析系统,了解数据分析系统的基本概念,数据分析系统的基本算法,典型系统包括TeraData, ExaData,DB2/PE等系统的使用;

·数据流系统:了解数据流处理的基本概念,数据流处理系统的基本算法,典型系统包括STREAM, TelegraphCQ,Storm等系统的使用;

·键值对存储系统:了解键值对存储的基本概念及其基本算法,典型系统包括bigtable,cassandra,dynamo等系统的使用;

·大规模并行数据处理系统:大规模并行处理的基本概念及其基本算法,典型系统MapReduce,GFS,Hadoop,HBase,Hive等系统的使用。

 

第二部分

·数据系统概述:了解数据系统40年来的发展历程,数据系统的主要分类;

·事务处理系统:典型事务系统设计原理与实现方法,典型事务系统包括Oracle,DB2, SQL Server, MySQL等

·数据分析系统,典型数据分析系统的设计原理与实现方法,典型系统包括TeraData, ExaData, DB2/PE,等;

·数据流系统:典型数据流系统的设计原理与实现方法,典型系统包括STREAM, TelegraphCQ, Storem等;

·键值对存储系统:典型键值对系统的设计原理与实现方法,典型系统包括bigtable,cassandra,dynamo等;

·大规模并行数据处理系统:典型大规模并行处理的设计原理与实现方法,典型系统MapReduce,GFS,Hadoop,HBase,Hive等。

 

第三部分

·数据系统的最新研究进展:数据系统的发展历程,最新研究进展,大规模并行处理系统,内存系统等;

·大规模并行事务系统:Megastore,Cloud SQL Server,Espresso,ElasTraS等;

·大规模并行分析系统:Dyrad,Pregel,Percolator,Piccolo等

·高通量事务系统:Oceanbase,Hekaton等;

·内存分析系统:HANA,Spark,Shark等

 

 

“数据存储与访问”课程

课程概述

信息化时代,很多企业都拥有海量的数据,包括各种业务操作数据、报表统计数据、办公文档、电子邮件、

Web数据等,如何有效存储和使用这些数据已经成为影响企业运行的关键因素。本课程主要介绍数据存储和访问相关的基本概念和相关技术。

课程大纲

第一部分

·数据存储和访问概述:了解数据存储设备、数据管理技术的发展历史;

·数据结构的基础知识:了解常用的数据结构和算法,包括队列、堆栈、链表、排序、LRU算法等;

·文件系统的基础知识:了解磁盘的基本结构,基于磁盘的文件系统,常用文件系统,以及访问文件系统中数据的基本方法;

·数据模型基础知识:学习常用的数据管理模型,包括关系模型、面向对象模型、星形模型、半结构化模型等;

·SQL语言:学习基本的SQL语句;

 

第二部分

·分布式数据管理的基础知识:包括事务处理、分布式提交、向量时钟、选主协议和一致性哈希等;

·键-值存储系统:了解以Bigtable、PNUTS和Dynamo等系统为代表的键-值存储系统的相关知识;

·数据一致性:了解CAP定理以及最终一致性相关的知识;

·可扩展的事务处理:了解在分布式环境下进行大规模事务处理的实现技术;

·OceanBase系统介绍:了解和使用OceanBase开源系统的管理和开发。

 

第三部分

·列存储数据库:了解以C-Store、MonetDB等系统为代表的面向列存储的数据库技术;

·高维数据的管理:了解R-Tree、X-Tree、M-Tree等面向高维数据管理的索引结构;

·半结构化数据的管理:了解XML数据的存储、索引和查询相关技术;

·时序数据的管理:了解时序数据中子序列匹配、近似查询等相关技术;

·P2P环境中的数据管理:了解Chord、Pastry等常用的P2P协议,以及P2P环境下数据索引和访问的相关技术;

 

 

“非结构化数据处理”课程

课程概述

相对于结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据。该课程以文本、网页和多媒体数据为研究对象,介绍非结构化数据的表示、组织和检索方法,以及各种典型的应用案例。

课程大纲

第一部分

·信息检索使用的应用场景介绍:了解其主要的应用场景和其重要的地位;

·信息检索涉及的NLP基础技术:了解与自然语言处理相关的基础技术(分词,去除停滞词,词干化等)和主要工具;

·信息检索任务定义和其软件体系结构:介绍人和机器在任务中的地位和角色;了解软件体系结构的概况;

·信息检索面向的研究对象:了解信息检索对象的获取手段(爬虫技术)以及基础的组织方式和访问方法(索引和查询方法);

·基础的检索评价标准:了解经典的检索性能评判标准,如precision,recall, MAP,MRR等;

 

第二部分

·基础信息检索模型:了解信息检索模型的分类,主要介绍经典模型(TF-IDF,向量模型,布尔模型,概率模型等);

·文档的语法表示:了解各种标记语言及其应用背景和功能,包括XML,HTML,RDF等;

·查询表示以及查询度量:不同的查询表达或表示方法,包括keyword based query, beyond keywords,structuredquery等;了解度量查询好坏的方法;

·查询重构:了解查询重构的原理和手段;

·文本分类技术:了解文本分类的技术原理和主要的工具,并利用工具对指定的文档实现分类。

 

第三部分

·并行、分布式信息检索:针对大规模数据的并行分布式数据组织,索引,查询技术以及实现;

·结构化文本检索:对文本的结构特征进行分析和利用支持有效地信息检索;

·多媒体信息检索:了解对多媒体数据进行数据组织和查询处理的技术;

·高级信息检索技术:介绍企业级搜索,图书馆,以及电子图书馆搜索面临的主要问题和解决手段;

·检索系统实现:实现一类信息检索系统,复习和考核学习成果。

 

 

“云计算安全精要”课程

课程概述

随着3G和移动互联网时代的到来,以及网格计算、虚拟化、自动化、SOA、容错技术、分布式海量数据仓库技术、并行数据处理、新一代数据中心等技术的突破、成熟和各项技术的大融合,通过网络访问非本地的计算服务(包括数据处理、存储和信息服务等)的条件越来越成熟,催生了信息技术及信息服务模式的集大成者 “云计算”。之所以称作“云”,是因为计算设施不在本地而在网络中,用户不需要关心它们所处的具体位置,可以方便的用各种终端登录“云端”来享受IT服务。

面对市场上铺天盖地的云计算宣传,各服务商为我们描绘了美好的前景,但其中的安全问题您考虑到了?如何在设计和运用云计算的同时避免其中的安全风险?有哪些解决方法可以帮到我们?围绕云计算安全的大量夸大的宣传和不确定性,本课程将透过其夸张的表象去剖析云计算的实质,为学员提供实践知识,确保学员了解真实的云计算安全问题和解决方案。

课程大纲

·云治理与全面风险管理

·信息生命周期管理

·虚拟化与计算资源调度

·可移值性和互操作性

·传统安全、业务连续性和灾难恢复

·数据中心

·事件响应、通告与应急

·应用层面安全

·加密和密钥管理

·身份与访问管理

·法律与电子证据发现

·合规性审计

 

 

“云计算的风险、安全和审计”课程

课程概述

全球互联的今天,不需要怀疑云计算是否能给企业用户带来便捷的应用,作为全球IT业的领导者Google(谷歌)、Amazon(亚马逊)、Microsoft(微软)等IT巨头已经为云计算的应用做出了榜样,虽然部分应用仅仅是刚刚起步,但已经可以预想未来便捷快速的web应用,云计算代表未来计算机服务的发展方向,它将广泛应用已经是大势所趋,越来越多的企业用户已经开始关注云计算服务。亚马逊宕机事件等一系列云服务提供商影响较大的网络故障,使得企业用户对云计算的安全性忧心忡忡,大型企业仍对云计算望而却步,首要的问题是安全,能够把企业的数据、甚至整个业务架构,交给云计算服务供应商吗?

针对新一代信息技术的发展进行跟踪研究,关注云计算环境企业信息化面临的风险,研究如何建立安全应对风险,云计算环境信息系统运维管理和信息安全管理的改进,探讨如何进行云审计以鉴证安全措施的效率和效果。

课程大纲

·什么是云计算:包括云计算定义 ;云计算服务交付模型(SPI)--SAAS,PAAS,IAAS;传统应用交付模式;云计算部署模式--公有云,私有云,社区云,混合云;采用云计算的主要驱动因素 ;云计算对用户的影响 ;云计算的管理 ;为什么不转向云计算?--企业采用云计算的障碍等内容。

·云计算风险--安全和隐私:包括数据分隔和保护;脆弱性管理;身份管理;物理和人员管理;可用性;应用安全;事件反应;隐私等内容。

·云计算风险--合规:包括业务持续和灾难恢复;日志和审计线索;特殊合规要求等内容。

·云计算风险--其它法律和合同要求:包括责任;知识产权;服务支持结束;审计要求等内容。

·云计算安全:包括云治理;法律法规;电子取证;合规和审计;信息生命周期管理;迁移和互操作;传统安全;业务持续和灾难恢复;数据中心运维;事件反应;通告和纠正;应用安全;加密和密钥管理;身份和访问管理;存储;虚拟化等内容。

·云计算审计:包括内部政策合规 ;治理、风险与合规(GRC) ;云计算的解释性控制目标 ;增加的针对云服务提供商(CSP)的控制目标 ;附加的密钥管理控制目标;云服务提供商(CSP)用户的控制考虑 ;监管/外部合规 ;其他要求;云安全联盟(CSA) ;审核云计算的合规性等内容。

 

 

“云计算精要”课程

课程概述

随着3G和移动互联网时代的到来,以及网格计算、虚拟化、自动化、SOA、容错技术、分布式海量数据仓库技术、并行数据处理、新一代数据中心等技术的突破、成熟和各项技术的大融合,通过网络访问非本地的计算服务(包括数据处理、存储和信息服务等)的条件越来越成熟,催生了信息技术及信息服务模式的集大成者 “云计算”。之所以称作“云”,是因为计算设施不在本地而在网络中,用户不需要关心它们所处的具体位置,可以方便的用各种终端登录“云端”来享受IT服务。

本课程主要阐述:云计算是什么?云计算发展的内外在动力是什么?云计算带来什么样的机会?主流云计算的工作机制是什么?云计算的主要技术原理有哪些?国内外有哪些最佳实践?如何运用云计算技术?企业如何向云计算转型和落地?

课程大纲

·云计算概述

1) 云计算的概念

2) 云计算产生的动力

3) 云计算的优势

·云计算结构

1) 结构概述

2) 云计算的工作机制

3) 基础架构作为服务

4) 平台作为服务

5) 应用作为服务

·云计算技术

1) 云计算的关键技术

2) 云计算的重大挑战

·云计算实践

1) 国际上的实践

2) 中国的实践

3) 云计算的落地

 

 

讲师团队

 

蒋龙

淘宝网高级技术专家,曾任MSRA研究员,毕业于北京大学信息管理系,在微软亚洲研究院(MSRA)从事自然语言处理、机器学习研究工作近5年。其间,作为技术负责人研发了微软对联系统。之后又加入MSRA机器翻译研究小组,随队参加了2008年NIST机器翻译评测比赛并获得了中英翻译第一英中翻译第二的成绩。2009年转入网络数据挖掘研究,为微软Engkoo项目(现为必应词典)提供了大规模的双语数据和名词术语翻译。2010年开始在Twitter的语义计算项目研究对Tweets的搜索排序和情感分析。在国际知名会议(ACL,IJCAI,SIGIR,CIKM,KDD等)累积发表10余篇文章,并拥有多项美国专利申请。"

 

张华平

博士,北京理工大学副教授,研究生导师,知名汉语分词系统ICTCLAS的创始人,计算机学院院长助理,大数据搜索挖掘实验室主任,中国计算机学会高级会员,中国中文信息学会社会媒体处理专业委员会常务委员,同时担任首都师范大学兼职副教授,辽宁师范大学客座教授。2005年毕业于中科院计算所。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863、973、242等科研课题十余项,发表专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。

 

刘鹏

现任奇虎360商业产品首席架构师,负责领导360的变现产品及工程,包括搜索广告、展示广告及大数据平台等。刘鹏于2004年在清华大学获得博士学位后,加入微软亚洲研究院,从事人工智能领域的研究。2009年一月,刘鹏参与创建雅虎北京研究院,出任高级科学家,负责日本雅虎搜索广告收入优化及其他全球广告项目。刘鹏还曾经担任MediaV (中国最大的DSP之一) 首席科学家、以及搜狐集团研究院院长等职。刘鹏还一直致力于大数据及其变现技术的普及工作,他讲授的《计算广告学》在网易云课堂和师徒网共有超过6000名的学生选课,已经成为业界相关公司进行相关培训的基础教程之一。此课还作为北大计算机系研究生课程和清华大学公开课讲授。

 

沈浩

中国传媒大学电视与新闻学院教授,博士,中国传媒大学调查统计研究所副所长,中国传媒大学数据挖掘研发中心主任,IPSOS益普索中国市场咨询有限公司首席技术顾问。15年的数据分析的专业经验,精通各种统计技术的分析方法和分析软件,在统计行业和市场研究行业享有较高的声誉。致力于数据挖掘、数据可视化,社会化媒体传播和营销方向的研究,2013年全球大数据技术峰会特邀演讲嘉宾。

 

姚斌

副教授,硕士生导师,于2011年8月毕业于美国佛罗里达州立大学,获博士学位,同年9月加入上海交通大学计算机科学与工程系。主要研究方向为数据管理,空间数据库,大数据分析与处理等。近五年内发表数据库领域顶级会议和期刊(如SIGMOD,ICDE,VLDBJ,TKDE)10余篇,主持和参与国家,省市级项目10余项。

 

马庆

信息系统审计和信息安全管理专家,毕业于北京化工大学应用数理系,拥有23年的实施、咨询经验,在技术管理方面具有丰富知识和经验,通晓电信运营商、金融行业信息系统软件、硬件、开发、运营、维护、管理和安全,熟悉业务运营管理的核心,能够利用信息系统审计技术,对信息系统的安全性、稳定性和有效性进行审计、检查、评价和改造。

 

戚正伟

博士,上海交通大学副教授, 入选2011年教育部新世纪人才计划,获得2012年教育部科技进步一等奖(排名第六),担任国家重大专项课题组副组长,2011年在CMU大学Edmund M. Clarke(图灵奖得主)处访问。主持三项国家自然基金和主持一项教育部精品课程,出版教材3部,在期刊和会议发表了50余篇论文,申请专利15项,获得授权6项。

 

肖凯

博士,上海交通大学讲师,2004年1月及2010年7月在诺丁汉大学获得理学硕士和哲学博士学位。2010年9月开始在上海交通大学软件学院任教,主要研究方向为医学及生物图像处理及分析、大数据、数据挖掘、模式识别和人工智能。

 

唐新怀

博士,上海交通大学副研究员,中国计算机学会普适计算专委会委员。主要研究方向为分布式计算、移动计算、面向服务计算、云计算与云存储技术 、中间件技术、软件自适应技术和海量信息处理技术。目前已在国内外期刊和国际会议发表论文30多篇,被SCI和EI索引10多篇。参加并负责过多项国家自然科学基金、国家863计划、上海市科委和上海市经信委等国家及省部级科研项目。申请并拥有三项专利技术。长期从事软件应用技术与相关产品的研制,与相关企业保持着密切的合作关系,善于产学研结合,善于把相关的研究与企业的技术创新联系起来。主要从事中间件技术,云计算相关技术,海量信息处理技术方面的研究。主讲课程有《大数据基础》,《云计算基础》,《中间件技术》,《数据库技术》等。

 

贾兆庆

博士,上海海事大学副教授。2008年获上海交通大学计算机软件与理论专业博士学位。研究内容包括P2P、网络计算中间件、云计算等。教授课程包括数据结构、数据挖掘、计算机组成与原理等。参与过多项国家、省部级项目,发表了20多篇学术论文。

 

阮彤

博士,华东理工大学副教授。2002年中科院软件所博士毕业,现任华东理工大学计算机技术研究所副所长,自然语言处理与大数据挖掘实验室主任,ACM会员。在华东理工大学计算机系从事软件工程教学。作为课题第一负责人,主持国家科技支撑计划“国际贸易区域经贸合作与流通促进关键支撑技术研究”课题,作为主要参与人,参与了国家科技支撑计划课题“区域性供应链业务协同服务平台研发及应用”。主持和参与了数十项上海市科委、经信委课题与企业课题。2012年获得上海市科委的“产学研合作奖”。近五年专注于互联网文本挖掘软件与关键技术,开发了基于本体的知识采集与展现系统、舆情分析系统,研发成果被盛大游戏,万达信息等多家大型企业采用。

 

钱夕元

博士,华东理工大学副教授。1990年以优异成绩毕业于华东理工大学数学系应用数学专业,并被保送直升本校攻读硕士研究生,毕业后留校任教。从事数学系本科统计课程教学数十年。2003年10月至2004年3月,国家公派到美国加州大学圣地亚哥分校(UCSD)学习进修半年。2008年7月在职获得计算机应用方向博士学位。2010年9月至2011年9月,作为访问学者公派到美国北卡罗琳达大学夏洛特分校(UNCC)研修一年。现担任理学院院长助理。主要从事统计计算、数值软件等方面的研究工作,先后在国内外核心期刊上发表论文二十余篇,作为负责人,承担教育部留学回国人员基金项目,完成了教育部中央高校基本科研业务费探索项目,上海市信息化项目及上海运筹学会金融证券委员会等多项课题研究。

 

 

+86 (021) 6660 0069
总部:上海市普陀区安远路518号宝华城市晶典大厦5楼
旧版入口

版权所有©伯特管理咨询公司   沪ICP备12025008号  沪公网安备 31010702001269号

微信
顶部
首页
关于我们
公司简介
专业积累
企业愿景
客户名录
友情链接
管理咨询服务
人力资源战略
定岗定编定薪
绩效激励体系
员工能力开发
人力资本管理
组织效能诊断
选拔招聘服务
人力资本软件
课程与训练营
培训与训练营
人力资本数字新闻
加入我们
加入我们
职业发展
员工留言
诚邀合作伙伴
在线留言
联系我们