-
金融行业的BI应用分析
所属栏目:[大数据] 日期:2021-01-18 热度:160
商业智能是一种提高企业智能化的手段,它可以满足企业发展的需要、提高企业的竞争力。同时,对于提高金融行业的风险管理、提升对外服务的质量都能够起到关键性的作用。 在市场竞争和银行业务转型期间,商业智能对于业务以及内部管理水平的提升起到了重要的[详细]
-
HDOJ -- 1002 大数A+B
所属栏目:[大数据] 日期:2021-01-18 热度:161
A + B Problem II Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Problem Description I have a very simple problem for you. Given two integers A and B,your job is to calculate the Sum of A + B. ? Input[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-18 热度:194
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从G[详细]
-
【数位DP】HDU3565-Bi-peak Number
所属栏目:[大数据] 日期:2021-01-18 热度:116
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=3565 Problem Description A peak number is defined as continuous digits {D0,D1 … Dn-1} (D0 0 and n = 3),which exist Dm (0 m n - 1) satisfied Di-1 Di (0 i = m) and Di Di+1 (m = i n[详细]
-
数据处理之——data.table
所属栏目:[大数据] 日期:2021-01-18 热度:154
副标题#e# data.table简介 关于 R 中的数据处理,我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法,而 data.table 则有着它自己的一套语法,它能处理几乎所有 dplyr 可以处理的数据,而且代码量更少,效率更高,特别是[详细]
-
日均请求量百亿级数据处理平台的容器云实践
所属栏目:[大数据] 日期:2021-01-18 热度:129
from:?http://geek.csdn.net/news/detail/97887 声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。? 作者:袁晓沛,目前在七牛云的主要工作是基于容器平台构建分布式应用,借助容器的优势,实现大规模分布式应用的自动化运维以及高可用,以Pa[详细]
-
如何计算文档相似性
所属栏目:[大数据] 日期:2021-01-18 热度:86
最近课题需要,整理一下文档相似性的一些研究,主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。 主要思路 01/one hot representation,BOW+tf-idf+LSI/LDA体系. docsim方法:gensim包,使用corpora.Dictionary(te[详细]
-
关联规则挖掘——Apriori算法
所属栏目:[大数据] 日期:2021-01-18 热度:131
前言 大二的时候,一个老师为了勾起我们对数据挖掘的兴趣,老是问我们这个问题:你们知道超市为什么要把啤酒跟尿布放在一起吗?但是从来没告诉我们答案。现在,很多人都听过这个问题,觉得很平常,但是那时的我真觉得挺神奇的。直到后来,了解了关联规则挖[详细]
-
在「不稀缺」的商业世界,如何挖掘稀缺的资源?
所属栏目:[大数据] 日期:2021-01-18 热度:105
要生存壮大,就要找到新的稀缺资源, 并且想尽办法掌握在自己手中。 文 | 曲凯 编者按:本文来源42章经(ID:MyFortyTwo),一家生产原创优质内容的科技媒体,誓同有趣、有料、有企图心的灵魂共成长。 “Technology increases access to what is scarce.[详细]
-
DB、ETL、DW、OLAP、DM、BI关系结构图
所属栏目:[大数据] 日期:2021-01-18 热度:136
(1)DB/Database/数据库——这里一般指的就是OLTP数据库,在线事物数据库,用来支持生产的,比如超市的买卖系统。DB保留的是数据信息的最新状态,只有一个状态!比如,每天早上起床洗脸照镜子,看到的就是当时的状态,至于之前的每天的状态,不会出现的你[详细]
-
51Nod-1116-K进制下的大数
所属栏目:[大数据] 日期:2021-01-18 热度:76
ACM模版 描述 题解 这里我们通过样例可以发现 A1A 的数位和是21,刚好是 K-1 的倍数,所以我们不妨多举几组数据测试一下,发现竟然都符合这个规律( ̄┰ ̄*),那么AC就不远了。 可是这里需要强调的是,K的最小值,如果K清一色的都是从2开始枚举,那么不用想[详细]
-
【重!磅!干!货
所属栏目:[大数据] 日期:2021-01-18 热度:185
副标题#e# 查看之前文章请点击右上角 ,关注并且 查看历史消息 ,还可以在文章最后评论留言。谢谢您的支持! 回复【文本挖掘】或者【点击阅读原文】获取链接与代码附录 一、 功能概述 ? ? ? ?关键词词频网络图是以股票论坛、 个股新闻、研究报告三个网站作[详细]
-
开源ETL工具kettle系列之常见问题
所属栏目:[大数据] 日期:2021-01-18 热度:123
摘要 本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 问题 Join 我得到A 数据流(不管是基于文件或数据库),A包含field1,field2,field3 字段,然后我还有一个B数据流,[详细]
-
开源ETL工具kettle系列之在应用程序中集成
所属栏目:[大数据] 日期:2021-01-18 热度:85
副标题#e# 摘要 本文主要讨论如何在你自己的Java应用程序中集成Kettle 集成 如果你需要在自己的Java应用程序中集成Kettle,一般来说有两种应用需求,一种是通过纯设计器来设计ETL转换任务,然后保存成某种格式,比如xml或者在数据库中都可以,然后自己调用程[详细]
-
开源ETL工具kettle系列之增量更新设计
所属栏目:[大数据] 日期:2021-01-18 热度:136
副标题#e# 前言 ETL中增量更新是一个比较依赖与工具和设计方法的过程,Kettle中主要提供Insert / Update 步骤,Delete 步骤和Database Lookup 步骤来支持增量更新,增量更新的设计方法也是根据应用场景来选取的,虽然本文讨论的是Kettle的实现方式,但也许[详细]
-
开源ETL工具kettle系列之动态转换
所属栏目:[大数据] 日期:2021-01-18 热度:126
副标题#e# 摘要 本文主要讨论使用Kettle来设计一些较为复杂和动态的转换可能使用到的一些技巧,这些技巧可能会让你在使用Kettle的时候更加容易的设计更强大的ETL任务。 动态参数的传递 Kettle 在处理运行时输入参数可以使用JavaScript 来实现,大部分工作只[详细]
-
开源ETL工具kettle系列之建立缓慢增长维
所属栏目:[大数据] 日期:2021-01-18 热度:146
副标题#e# 摘要 本文主要介绍使用kettle 来建立一个Type 2的Slowly Changing Dimension 以及其中一些细节问题 Kettle 简介 Kettle 是一个强大的,元数据驱动的ETL工具被设计用来填补商业和IT之前的差距,将你公司的数据变成可增长的利润. 我们先来看看Kettl[详细]
-
大数据分析公司Kentik完成230万美元B轮融资
所属栏目:[大数据] 日期:2021-01-18 热度:147
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 数据的[详细]
-
互联网金融之量化投资深度文本挖掘——附源码文档
所属栏目:[大数据] 日期:2021-01-18 热度:54
副标题#e# ?? 【重!磅!干!货[详细]
-
hdoj 5834 Magic boy Bi Luo with his excited tree 树形dp
所属栏目:[大数据] 日期:2021-01-17 热度:171
假设 1 为 根节点 dp[i][0] 代表从自己出发选择到儿子节点最后必须返回自己的最大价值 dp[i][1] 代表从自己出发选择到儿子节点最后可选择不回来的最大价值 并记录最后选择的离开节点 id[i] 树形dp先跑一遍出来 再第二遍 dfs 因为每个节点也可以流向父节点[详细]
-
HDOJ 5832 A water problem(高精度 大数取模)
所属栏目:[大数据] 日期:2021-01-17 热度:156
A water problem Time Limit: 5000/2500 MS (Java/Others)????Memory Limit: 65536/65536 K (Java/Others) Total Submission(s): 826????Accepted Submission(s): 428 Problem Description Two planets named Haha and Xixi in the universe and they were[详细]
-
业务渗透思路总结
所属栏目:[大数据] 日期:2021-01-17 热度:93
-
Hdu 5834 Magic boy Bi Luo with his excited tree(从树上每个点
所属栏目:[大数据] 日期:2021-01-17 热度:167
传送门:Hdu 5834 Magic boy Bi Luo with his excited tree 题意:给你一棵树,有n个点,每个点都有一个利润,每条边都有一个花费,问从每个点出发,获得的最大的利润为多少(每个点上的利润只能取一次,每条边每走一次就要花费) 思路:我们任意选取一个根,每个点都[详细]
-
大数据处理需要用到的编程语言开发语言
所属栏目:[大数据] 日期:2021-01-17 热度:115
你有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,我该迫使我的所有开发人员和数据科学家[详细]
-
51nod1030 大数进制转换
所属栏目:[大数据] 日期:2021-01-17 热度:72
题目描述 给出一个36进制的大数A(0-9,A-Z),将其转为10进制并输出。 每一位用’0-9”,’A-Z’来表示,A的长度 = 100000) a进制数k转b进制问题 第一位(最低位)=k%b 第二位=k/b%b 第三位=k/b^2%b …… (这个应该是比较显然的) 然而A的长度 = 100000,太大了[详细]