本项目围绕研究生和本科生高精特课程建设要求,开发管理信息系统理论与方法、机器学习、数据库原理与方法、高级项目管理、管理系统建模与仿真等课程教学平台,满足师生教学及科研需要,具体内容如下。 1.机器学习模块 (1)具体内容及要求 ①机器学习算法,包括:特征选择算法、特征抽取算法、关联规则算法、分类和预测算法。 ②推荐系统算法,主要包括协同过滤算法、 网上购物推荐系统算法、网上购物实时分析需求理解算法、Parquet文件格式读取、处理工作流程、结构化流式处理、对流数据进行过滤/分组/求值,并将结果通过流输出。 ③围绕商务应用领域,至少提供监督式学习(supervised Learning)案例和非监督式学习(unsupervised Learning)案例各1个。 (2)平台开发环境及性能要求 ①平台架构采用J2EE开发;算法采用Java、Python、R语言均可。 ②性能要求:满足250人同时上线使用。 2.数据库管理系统模块 (1)具体内容及要求 ①分布式数据库HBase ,主要包括HBase数据类型、HBase写流程、HBase读流程、HBase Region管理、HBase Region分区及定位、HBase过滤器、HBase行锁、HBase WAL机制、HBase Scan、HBase计数器 、HBase协处理器 、HBase复制。SpringBoot开发HBase实现用户信息数据表的CRUD, 包括SpringBoot项目结构、初始化连接、创建用户表、添加用户数据、全表扫描、按行扫描、删除行、删除列、关闭连接。 本部分案例为分布式数据库HBase实现微博系统,包括微博系统需求分析、创建命名空间及表、实现发布微博内容功能、实现添加关注的人/查看关注的人/移除(取消关注) 用户功能、实现查看我的粉丝功能、实现获取关注的人的微博 内容功能、实现查看我发布的微博。 ②Hive 数据库管理系统,主要包括Hive库基本操作 、Hive表基本操作 、Hive DML、Hive集合数据类型、Hive基本查询 、Hive分桶表 、Hive分区表 、Hive内部表和外部表 、Hive连接方式 和Hive数据导入导出 ③本部分案例包括: a.Hive分析用户访问数据、 用户访问数据需求分析、创建用户表、创建用户数据、查看用户访问信息。 b.建立学生成绩信息管理系统,实现操作学生成绩数据的增、改、删、查等功能。 c.Hive影评数据分析 包括影评数据需求分析、创建影评表、创建影评数据、对影评结果进行分析。 d.MongoDB存储朋友圈评论内容,包括社交APP需求分析、实现点赞功能、实现评论功能、实现数据查询功能。 e.MongoDB存储商品分类信息 包括商品信息需求分析、创建商品表、创建商品数据、实现传统存储方式、实现Entity Attribute Values 形式存储、MongoDB存储方式、数据扩展; f.MongoDB博客系统开发,包括博客系统需求分析、准备nodejs/express/MongoDB、创建数据库、创建视图文件、创建网页JS文件。 (2)平台开发环境及性能要求 ①平台架构采用J2EE开发;算法采用Java、Python、R语言均可。 ②性能要求:满足250人同时上线使用。 3. 搜索引擎ElasticSearch (1)具体内容及要求 ①ElasticSearch数据操作、ElasticSearch索引常用操作、ElasticSearch数据查询、ElasticSearch映射、ElasticSearch Query查询和Filter查询、ElasticSearch分词器、ElasticSearch复合查询、ElasticSearch Metric聚合、ElasticSearch Bucker聚合、ElasticSearch Java API。 ②本部分案例包括: a.Elasticsearch员工信息搜索,包括员工信息需求分析、员工文档检索、检索文档、DSL查询 、全文搜索、精确字段搜索、高亮搜索显示及分析功能。 b.Elasticsearch图书系统查询系统,包括图书信息需求分析、准备数据、基本匹配查询、多字段查询、Boosting算法、Bool查询、模糊查询、通配符查询、正则查询、匹配短语查询、匹配短语前缀查询、查询字符串、术语查询等。 c.ElasticSearch实现电商网站搜索系统,包括电商网站需求分析、简单商品查询、综合商品查询、相关商品推荐、聚合搜索商品相关信息 (2)平台开发环境及性能要求 ①平台架构采用J2EE开发;算法采用Java、Python、R语言均可。 ②性能要求:满足250人同时上线使用。 三、项目的其他要求 1. 为减少仿真平台的维护工作,提供250个平台使用账号,满足250名师生同时在线使用的需要,云平台的服务期限为2022.11-2025.12;平台账号应满足永利奉贤校区、徐汇校区同时使用。 2.仿真平台支持模块化教学,实现基于人才培养方案定制教学课程和仿真实验项目,配合日常的教学计划提供课前、课中、课后的教学管理。 3.仿真平台支持项目案例教学,课程周期应从 1 周到 22 周的跨度,支持学期末学生的课程设计、校内综合实习仿真实训及教师科研项目中数据分析的需要。达成在校内即可以完成企业级的教学及科研活动。 3.仿真平台应提供接口导入第三方的数据。 平台提供嵌入式实验支持,包括管理信息系统理论与方法、管理系统建模与仿真课程的在线编程环境,支持和第三方实验平台的无缝融合。 4.平台应提供强大的学习和科研支撑能力,包括代码的在线编写、代码质量管理、代码评审、测试管理资源推送、轻量化 PBL、仿真结果报告自动编写等功能。 5.仿真平台应支持不同的知识类型,提升师生学习和科研效率,降低认知负荷。 |