-
ArcGIS Desktop 无法录入数据处理一例
所属栏目:[大数据] 日期:2020-12-24 热度:111
最近,搭建了一个DB2的测试环境,装完系统后,发现有一个美国带的样例数据无法导入,详细环境如下: 桌面:Desktop 10.3.1 DB2: V97 FP8 X64 For NT 从错误信息上得不到任何的提示,继续做测试 导入数据的时候出了空间字段,属性字段全部删除,可以导入进去[详细]
-
URAL - 1153 Supercomputer 大数开方
所属栏目:[大数据] 日期:2020-12-24 热度:72
??????? 题意:给定m,m = n * (n+1) / 2,计算n值。 ????? 思路:n = SQRT(m*2) ???? 注意m很大,需要自己实现大数开方。我用的是自己写的大数模板:大数模板 AC代码 #include cstdio#include cmath#include algorithm#include cstring#include utility#i[详细]
-
[bigdata-047] 禅道 ubuntu 配置开机自启动服务 开机启动
所属栏目:[大数据] 日期:2020-12-24 热度:200
1. 在/etc/init.d目录下创建chandao文件 内容如下: #!/bin/bash /opt/lampp/lampp restart 然后增加全选 chmod 755 chandao 2. 运行runleve命令,查看现在的run level是多少,通常是2 3. 既然是2,就在/etc/rc2.d目录下,创建一个链接 ln -s /etc/init.d/c[详细]
-
[bigdata-048] git使用 上
所属栏目:[大数据] 日期:2020-12-24 热度:164
0. 主要参考 http://www.liaoxuefeng.com 1. git是分布式版本管理器,每个人的电脑都是一个完整的版本库。你修改了文件A,你同事修改了文件A,你们可以将各自的修改推给对方,可以互相看到对方的修改。 2. 创建版本库repository ? 2.1 在一个合适的地方,[详细]
-
算法训练 区间k大数查询
所属栏目:[大数据] 日期:2020-12-24 热度:100
问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整数m,表示询问个数。 接下来m行,每行三个数l,r,K,表示询问序列从左[详细]
-
内衣大数据分析:透过女生内衣的需求变化,看年轻人的情趣生活
所属栏目:[大数据] 日期:2020-12-24 热度:156
报道大数据企业:大数据产品、大数据方案、 ? 大数据人物 分享大数据干货:大数据书籍、大数据报告、 大数据视频 本文系大数据人精选自网络。 欢迎更多优质原创文章投稿给大数据人:admin@bigdata.ren 小编微信:data985 End. 版权声明:由“大数据人”推[详细]
-
[bigdata-041] python3+re 正则表达式 手机号微信号qq号
所属栏目:[大数据] 日期:2020-12-24 热度:66
import reREGEX_PHONE = re.compile(r'1d{10}',re.IGNORECASE)REGEX_QQ = re.compile(r'[1-9]d{4,10}',re.IGNORECASE)REGEX_WX1 = re.compile(u'微信[w,-]{1,20}'.encode('utf8'),re.IGNORECASE)#正则手机号码def get_all_phone_num(s1): global REGEX_[详细]
-
3.21.1、BI之SSIS之数据流转换(渐变维度-混合模式)
所属栏目:[大数据] 日期:2020-12-24 热度:139
BI之SSIS之数据流转换(渐变维度-混合模式) ? ? 1??????????3.21中介绍了普通模式的渐变维度,即通过时间标志来对维度属性值的变化进行记录,这种方式可以很直观的看到变化的时间点,但是在使用时却比较麻烦,因为你需要通过时间字段去判断 ? 2??????????[详细]
-
[bigdata-039] pysql+pymongo+py3把数据从sql 导入 到mongo的通
所属栏目:[大数据] 日期:2020-12-24 热度:76
#!/usr/bin/env python3#! coding:utf-8 -*-import pymysqlimport pymongodef trans_data_from_mysql_to_mongo(source_param,target_param,trans_type,where_clause,ignore_columns=[]): # 创建mysql连接 mysql_conn = pymysql.connect(host=source_param[[详细]
-
使用机器学习和大数据预测心脏病
所属栏目:[大数据] 日期:2020-12-24 热度:63
副标题#e# 编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使[详细]
-
[bigdata-040] cloudera manager web服务故障处理
所属栏目:[大数据] 日期:2020-12-24 热度:117
1. cloudera manager的web服务挂了 2. 根据文档进行重启 https://www.cloudera.com/documentation/enterprise/5-4-x/topics/cm_ag_server.html sudo service cloudera-scm-server start 无效,在10.14.x.x:7180上没有服务 lsof -i:7180上能看到端口占用。[详细]
-
HDU 2054 大数比较
所属栏目:[大数据] 日期:2020-12-24 热度:177
题目传送门:http://acm.hdu.edu.cn/showproblem.php?pid=2054 ???? ?? A这个水题也没有什么意思,主要巩固前面Java大数类和一些方法的学习。 ??? ?? 题目如果直接用Java.Biginteger.equals()方法的话会WA,在API说明里面,对于2.00,和2.0值相等,标度不[详细]
-
成为技术高手:想更了解自己的偶像么?教你用技术手段挖掘他#92
所属栏目:[大数据] 日期:2020-12-24 热度:83
点击上方“云栖社区”可以订阅哦 摘要 是否在不同的电影中,总是能看到那些熟悉却叫不上名字的演员们,想知道他们之间相互的关系么?本文将带你一步一步地挖掘出他们的关系。想更了解自己的偶像么,那就试试吧。 以下为译文 我最近换了个工作,在入职之前[详细]
-
微信红包先抢和后抢差距居然这么大!春节抢红包的大数据分析
所属栏目:[大数据] 日期:2020-12-24 热度:88
副标题#e# 春节是中华民族隆重的农历新年 这是世界上规模最大的节日 在春节前后 炎黄子孙们不远万里衣锦还乡 与亲人们团圆 在此期间 中国的铁路上会发生 地球上最大规模的人口迁徙 作为世界上最能吃最能玩的种族 聪明勇敢的中国人发明了非常多的娱乐活动 比[详细]
-
NMEA library数据处理过程分析
所属栏目:[大数据] 日期:2020-12-24 热度:98
? ?今天学习一个GPS数据解析开源库——NMEA lib。使用这个库,可以轻松处理GPS接收机发出的数据,并不需要了解NMEA的具体协议,这个库可以解析所有NMEA0813规定的所有报文格式。不仅可以解析出原始数据中包含的所有参数,还可以计算两点之间的距离、方向以[详细]
-
打车不再加价?大数据说可以有
所属栏目:[大数据] 日期:2020-12-24 热度:50
副标题#e# 高峰期打车的供求关系不均衡的问题,一直被诟[详细]
-
携程BI团队实践:推荐系统中基于深度学习的混合协同过滤模型
所属栏目:[大数据] 日期:2020-12-24 热度:140
副标题#e# 背景 近些年,深度学习在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段。 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级[详细]
-
[bigdata-033] 互联网金融-大数据架构平台和业务流程
所属栏目:[大数据] 日期:2020-12-24 热度:96
一张图,excited![详细]
-
BloomFilter——大规模数据处理利器
所属栏目:[大数据] 日期:2020-12-24 热度:58
原文:http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html 笔记: 类似bloombit,用来查找某个东西是否存在,可以允许少量错误率 bloombit 先定义一个bit数组,插入时将数据hash后置位相应的位,查询时看相应的位是否置位,这样会有一定的出错[详细]
-
电商如何上了bi的道?
所属栏目:[大数据] 日期:2020-12-24 热度:118
副标题#e# (这就不要跟我提淘宝京东唯品会之类的了,这条道本就是他们趟出来的,以下主要针对垂直电商以及传统零售转电商一类) BI这条道不再新鲜了,但也是有些公司上来了,有些没上来。没上来的可能还不确定什么时机该上,上来的也是各有各的苦衷,家家[详细]
-
算法训练 区间K大数
所属栏目:[大数据] 日期:2020-12-24 热度:108
算法训练 区间k大数查询 ? 时间限制:1.0s ? 内存限制:256.0MB ? ? 问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整[详细]
-
[bigdata-34] pyenv + anaconda 4.2 + python3.5+ ubuntu 16.04
所属栏目:[大数据] 日期:2020-12-24 热度:77
1. pyenv 官网 https://github.com/yyuu/pyenv 2. 安装 git clone https://github.com/yyuu/pyenv.git ~/.pyenv echo 'export PYENV_ROOT="$HOME/.pyenv"' ~/.bashrc echo 'export PATH="$PYENV_ROOT/bin:$PATH"' ~/.bashrc echo 'eval "$(pyenv init -)"'[详细]
-
MPP DB 是 大数据实时分析系统
所属栏目:[大数据] 日期:2020-12-24 热度:147
大数据领域,实时分析系统(在线查询)是最常见的一种场景,前面写了一个《 实时分析系统 (HIVE/HBASE/IMPALA) 浅析 》讨论业界当前常见的方案。互联网公司用得比较多是 HIVE/HBASE ,如腾讯基于 HIVE 深度定制改造,改名为 TDW ,小米等公司选用 HBASE 等[详细]
-
BI学习计划
所属栏目:[大数据] 日期:2020-12-24 热度:131
1??????????《数据仓库》——比尔.恩门,主要介绍什么是数据仓库 2??????????SSIS设计与开发 2.1?????????BIWORK的微软SSIS系列 2.2?????????微软MSDN之SSIS系列 3??????????SSAS设计与开发 3.1?????????BIWORK的微软SSIS系列 3.2?????????微软MSDN之SSIS[详细]
-
BI导论——数据仓库概论
所属栏目:[大数据] 日期:2020-12-24 热度:106
1??????????书名《Building the Data WareHouse》作者:比尔.恩门 2??????????目的:将积累的数据变成信息,以建立决策支持系统(DSS) 3??????????原有的DSS是分裂的,按需抽取的,导致重复与低效 4??????????原始数据与DSS数据对比与差异 4.1?????????原[详细]