我如何用两行代码节省了30%的CPU

ClickHouse 是一个开源的用于实时数据分析高性能列式分布式数据库,支持向量化计算引擎、多核并行计算、高压缩比等,在分析型数据库中单表查询性能第一。滴滴从…

记一次glibc导致的堆外内存泄露

( 本文阅读时间:15分钟 )
01
问题现象
团队核心应用每次发布完之后,内存会逐步占用,不重启或者重新部署就会导致整体内存占用率超过90%。

发布2天后…

基于模式挖掘的可靠性治理探索与实践

本文整理自美团技术沙龙第77期《美团亿级流量系统的质量风险防控和稳定性治理实践》。本文介绍了基于模式挖掘的可靠性治理探索,为通过技术手段解决该领域代表性问题开启…

灵魂三问之稳定性摸排

( 本文阅读时间:15分钟 )

01 前言
这个季度主推安全月构筑&夯实稳定性底盘,就组织了组里的同学对核心业务链路进行了稳定性的摸排。在摸排过程…

超大规模数据库集群保稳系列之三:美团数据库容灾体系建设实践

本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第3篇文章。
本文重点介绍了…

开放网关架构演进

( 本文阅读时间:10分钟 )
淘宝开放平台是阿里与外部生态互联互通的重要开放途径,通过开放的产品技术把阿里经济体一系列基础服务,像水、电、煤一样输送给我们的…

代码变更风险可视化系统建设与实践

本文整理自美团技术沙龙第77期《美团亿级流量系统的质量风险防控和稳定性治理实践》。文章第一部分介绍了软件系统风险与变更;第二部分介绍了代码变更风险可视化系统的能…

基于Go语言的滴滴DevOps重塑之路

研发效率和系统稳定性是研发团队永远无法绕开的话题,前者决定业务迭代效率,而后者决定交付质量。多年来,滴滴在保障稳定性的前提下不断探索更高效的技术手段,积累了大量…

大数据SQL数据倾斜与数据膨胀的优化与经验总结

( 本文阅读时间:5分钟 )
01 背景
目前市面上大数据查询分析引擎层出不穷,如Spark,Hive,Presto等,因其友好的SQL语法,被广泛应用于各领…

干货 | 故障召回率提升34%,携程智能异常检测实践

作者简介
零一,携程算法工程师,专注于智能告警、容量管理、根因定位等领域。
一、背景
携程作为在线旅游公司,对外提供机票、酒店、火车票、度假等丰富的旅游产品,其…

这些年背过的面试题——分布式篇

阿里妹导读
本文是技术人面试系列分布式篇,面试中关于分布式都需要了解哪些基础?一文带你详细了解,欢迎收藏!

分布式系统是一个硬件或软件组件分布在不同的网络计…

干货 | 携程火车票异常检测和根因定位实践

作者简介
龙川泾渭,携程算法工程师,专注异常检测、根因分析、时间序列预测等领域。
摘要
携程火车票包含1000+的业务指标,人工监测指标的异常情况耗时费力,而由…

网约车服务端线上流量巡检与测试验收技术

摘要
滴滴网约车致力于让出行更美好,平台为司乘提供良好体验的同时承载了广大群众的出行服务,致使我们对服务可用性的要求较高。更快地发现系统bug,可以让更少的司乘…

探索ES高可用:滴滴自研跨数据中心复制技术详解

Elasticsearch 是一个基于Lucene构建的开源、分布式、RESTful接口的全文搜索引擎,其每个字段均可被索引,且能够横向扩展至数以百计的服务器存…

滴滴线下仿真环境实践:从方案设计到持续运营

在软件开发的过程中,测试环境无疑是一个关键的组成部分,其为开发、测试团队提供一个安全、隔离的环境来验证软件的功能、性能和稳定性。
通常在业务发展的早期,整体的系…

复杂业务逻辑下的智能告警与故障定位该怎么做?

随着出行业务的发展与行业技术的革新,滴滴在业务上和技术上都在与时俱进,这个过程中呈现了其独有的特点与难点。
在业务上,滴滴既要有严谨的交易逻辑和计算复杂的业务系…

微服务井喷时代,我们如何规模化运维?

随着云原生技术发展及相关技术被越来越多运用到公司生产实践当中,有两种不可逆转的趋势:
1、微服务数量越来越多。原来巨型单体服务不断被拆解成一个个微服务,在方便功…

服务拓扑串联难?eBPF为滴滴可观测带来解题新思路

上篇文章我们讲到可观测性在滴滴的实践与落地,更多关注的是不同观测信号之间的关联关系。那服务与服务之间的关系又如何串联,业界当前爆火的 ebpf 又在滴滴有着怎样…

压多少抗多少,滴滴全链路压测仿真度量体系建设

滴滴在重大节假日、活动前为保障线上系统稳定,需要通过全链路压测做多轮风险排查以及容量验收,我们经常听到这样的声音"你们全链路压测和线上业务场景有多大…

我们是如何做数据稳定性保障的?

滴滴客服业务属于强运营的业务,运营的核心抓手是指标数据。这些指标有的是为了达成战略目标的OKR指标,有的是为了达成与合作伙伴结算的结算指标,做好数据稳定性,对整…