数据工程师常见的10个数据统计问题

****数据工程师自诩自己是“比任何软件工程师更擅长统计,比任何统计学者更擅长软件工程的人”。这里枚举了数据工程师常见的10个数据统计问题,希望对大家有所帮助。…

干货 | 节约60%开发工时,离在线一体化数仓系统在携程旅游的落地实践

作者简介
Chengrui,携程后端开发专家,关注实时数据处理、AI基础平台建设以及数据产品等领域。
本文主要介绍离在线数据仓库建设在携程旅游团队的落地与实践,…

Apache Flink在滴滴的应用与实践

导读:Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态计算。可部署在各种集群环境,对各种大小的数据规模进行快速计算。…

干货 | 每天十亿级数据更新,秒出查询结果,ClickHouse在携程酒店的应用

作者简介
蔡岳毅,携程酒店大数据高级研发经理,负责酒店数据智能平台研发,大数据技术创新工作。喜欢探索研究大数据的开源技术框架。
一、背景
1)携程酒店每天有上千…

Java程序员,你一定需要了解的六款大数据采集平台

亲爱的小伙伴,抽点时间帮忙投一下票,选一下您目前所处的阶段,以便后期推出更多对您有帮助的文章和内容哦!
随着大数据越来越被重视,数据采集的挑战变的尤为突出。今天…

图解Storm并发机制及其执行流程

一、Storm架构简介
在上一篇,我们对Storm集群进行了搭建,并使用Java完成了代码的演示,我们知道在Storm中,先要设计一个用于实时计算的图状结构,我…

大数据时代必修技能 阿里HBase又放出了哪些大招?

前言
HBaseCon是Apache HBase官方举办的技术会议,主要目的是分享,交流HBase这个开源分布式大数据存储的使用和开发以及发展。HBaseCon…

深度 | 两个案例,掌握AI在大数据领域的前沿应用

阿里妹导读:近日,全球技术学习技术大会首次在京举行,阿里巴巴数据技术及产品部资深算法专家杨红霞(鸿侠)作为特邀嘉宾出席并发表主题演讲。鸿侠从什么是数据新能源说起…

你的数据库密码还在裸奔吗?试一试Druid数据库密码加解密吧!

Druid的功能

1、替换DBCP和C3P0。Druid提供了一个高效、功能强大、可扩展性好的数据库连接池。
2、可以监控数据库访问性能,Druid内置提供了…

阿里、Uber、谷歌、苹果的大牛都来了,Apache Flink技术盛宴有何魅力?

阿里妹注:今年4月,第三届Flink Forward大会在旧金山举行。Google,Uber,Airbnb,Amazon,Apple,Facebook等公司大牛…

阿里HBase超详实践总结 | 一文读懂大数据时代的结构化存储

前言
时间回到2011年,Hadoop作为新生事物,在阿里巴巴已经玩得风生水起,上千台规模的”云梯”是当时国内名声显赫的计算平台。
这一年,Hadoop的好兄弟…

【友盟+】COO叶谦:解读全域大数据战略背后的技术演进

今年年初,Oracle发布了一份大数据变化趋势报告,报告中指出,越来越多的企业将用户分析甚至是企业应用同大数据加以结合。从AI支持型应用到Megabox等数据流…

Linux操作系统安装ELK stack日志管理系统–(2)Elasticsearch与Kibana的安装与使用

前言

Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎。它允许您快速和近实时地存储,搜索和分析大量数据。
Kibana作为日志的过滤web展…

双11技术电子书精彩内容节选–大数据技术篇

双11数据大屏背后的实时计算处理
作者:藏六 黄晓锋 同杰
双11数据大屏的实时计算架构
2016年的双11我们的实时数据直播大屏有三大战场,它们分别是面向媒体…

tataUFO 大数据应用实践

感谢tataUFO各位同仁的大力支持,帮助我顺利完成了在QingCloud Insigt 2016技术大会上的演讲,特将讲稿PPT分享出来,共勉!

一、引子