博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据相关总结(待续)
阅读量:7050 次
发布时间:2019-06-28

本文共 389 字,大约阅读时间需要 1 分钟。

“区块链”、文本分析、hadoop、lucence
文本分析是说词性分形,
分词应该是搜索引擎中的分词器  比如现在最常用的是ik  原来的是庖丁
需要做分词索引:
eg:你干嘛呢  
你 , 干嘛,呢
分析词性和词义还有词频,分词一般就是中文麻烦点,英文简单
lxh:
通过海量数据计算分析  可以提取出有用的数据关系模型  这些数据关系模型可以做推荐  可以计算用户行为  可以做人物或者城市画像等等
eg1:
 拿到北京200w浮动车数据点  计算到北京的所有的道路网络上  计算出每条道路的拥堵程度  车速  通行时间
eg2:
在电信做的工作就是拿到电信收集到的全国2e人的信令数据 计算分析  算出每个人工作在那里  每天几天上下班  加班多不多  下周二可能出现在那里 平时喜欢做什么  再比如每天地铁站几点开始拥堵  需要限流排队  某个景点在每年的什么时候出现高峰  高峰值大概什么样  预测规划这样的。

转载地址:http://becol.baihongyu.com/

你可能感兴趣的文章
【百川云栖分享】承渊:助力移动App从0到N—— 解读阿里百川移动开放平台
查看>>
访问云数据库HBase版的WebUI
查看>>
【云栖大会】阿里云唐洪:飞天,向世界要一个答案
查看>>
浅析Struts1和Struts2的Action线程安全问题
查看>>
OpenCV Mat —— 基本的图像容器
查看>>
JAXB -java<->xml
查看>>
数据结构实践项目——排序
查看>>
《C语言及程序设计》实践参考——循环的嵌套流程图
查看>>
物联网与互联网,云计算,大数据的互联结合产生超凡的应用
查看>>
【阿里招聘】那年,差点被阿里面试官掰弯
查看>>
C# 调用存储过程
查看>>
MySQL 5.7.6: Make InnoDB fill factor settable
查看>>
Android--短信拦截及IP拨号
查看>>
Aspectj 实现Method条件运行
查看>>
DevOps与阿里云容器服务(一)
查看>>
标准MD5加密工具类
查看>>
因果图在运维工作中的应用
查看>>
阿里巴巴运营专家陈哲:阿里无线开放生态
查看>>
线程的优先级
查看>>
AM335x(TQ335x)学习笔记——WM8960声卡驱动移植
查看>>