如何成为一名靠谱的职场人

带团队几年后,很容易快速判断一个同学是否靠谱。那什么是靠谱?即你把一个事情交给一个人后,完全不用操心后续,因为你知道他肯定能落实,就算中间有困难,他也会及时给与你反馈,然后一起协商后续应该如何快速解决此问题。如果靠谱度需要分级的话,我会将其分为三层:做完、做好、做到极致。但是靠谱度是可以培养的,我认为做好以下几点就基本可以胜出了。

1、能拿结果

即做事情要站在结果的角度去考虑和解决问题,以终为始,从目标开始考虑需要什么条件,然后主动想办法去创造条件从而达成问题的解决。但是不要把“过程导向”和“结果导向”对立起来二选一,实际上在职场中,结果导向并不意味着不重视过程,恰恰相反,而是要用以终为始的心态,带着清晰的目标,善用3W分析法,去开启和推进做事情的过程。

2、具备闭环思维

简单来说就是“凡事有计划,约定必落实,问题早知会,及时报进程,事后须反馈”。闭环思维的培养需要多使用PDCA法则指导自己。

Read More

如何打造一个高绩效团队

目标设定

目标透视镜

看大环境

  • 看行业:政治、经济、社会、技术,导致的行业规模变化
  • 看公司:行业竞争导致的公司战略变化
  • 看业务线:根据公司战略看业务导向变化

看小环境

  • 事业群/部目标和上级目标
  • 内/外部客户和资源方需求
  • 本岗位要求和自身发展需求

主抓工作

  • 三大主抓工作
  • 里程碑
  • 助力/阻力

目标设定的原则(SMART原则)

  • Specific=明确的,清晰的
  • Measurable=具体、量化、可衡量
  • Achievable=可达成并具有挑战性
  • Relevant=有相关性、实际可行
  • Time bound=有完成时限

Read More

Elasticsearch 在滴滴的应用与实践

滴滴 Elasticsearch 简介

简介

Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 接口的全文搜索引擎,其每个字段均可被索引,且能够横向扩展至数以百计的服务器存储以及处理 TB 级的数据,其可以在极短的时间内存储、搜索和分析大量的数据。

滴滴 ES 发展至今,承接了公司绝大部分端上文本检索、少部分日志场景和向量检索场景,包括地图 POI 检索、订单检索、客服、内搜及把脉日志 ELK 场景等。滴滴 ES 在2020年由2.X升级到7.6.0,近几年围绕保稳定、控成本、提效能和优生态这几个方向持续探索和改进,本文会围绕这几个方向展开介绍。

架构

Read More

滴滴基于 Clickhouse 构建新一代日志存储系统

背景

此前,滴滴日志主要存储于 ES 中。然而,ES 的分词、倒排和正排等功能导致其写入吞吐量存在明显瓶颈。此外,ES 需要存储原始文本、倒排索引和正排索引,这增加了存储成本,并对内存有较高要求。随着滴滴数据量的不断增长,ES 的性能已无法满足当前需求。

在追求降低成本和提高效率的背景下,我们开始寻求新的存储解决方案。经过研究,我们决定采用 CK 作为滴滴内部日志的存储支持。据了解,京东、携程、B站等多家公司在业界的实践中也在尝试用 CK 构建日志存储系统。

挑战

面临的挑战主要来自下面三个方面:

  • 数据量大:每天会产生 PB 级别的日志数据,存储系统需要稳定地支撑 PB 级数据的实时写入和存储。
  • 查询场景多:在一个时间段内的等值查询、模糊查询及排序场景等,查询需要扫描的数据量较大且查询都需要在秒级返回。
  • QPS 高:在 PB 级的数据量下,对 Trace 查询同时要满足高 QPS 的要求。

为什么选 Clickhouse

  • 大数据量:CK 的分布式架构支持动态扩缩容,可支撑海量数据存储。
  • 写入性能:CK 的 MergeTree 表的写入速度在200MB/s,具有很高吞吐,写入基本没有瓶颈。
  • 查询性能:CK 支持分区索引和排序索引,具有很高的检索效率,单机每秒可扫描数百万行的数据。
  • 存储成本:CK 基于列式存储,数据压缩比很高,同时基于HDFS做冷热分离,能够进一步地降低存储成本。

架构升级

Read More

关于做好技术团队管理的几点心得

技术Leader核心工作是让团队拿更好的成绩,日常工作主要是制定方案、推进业务、掌控下属、协助领导等四项内容,本次分享主要分享最基础也是最重要的管理职责:

  • 调动团队同学的工作积极性
  • 让团队同学更高更快的成长

1、如何调动团队同学的工作积极性?

  • 精确的指示。需要更强调为什么做和这么做的意义,没有计划和目的的命令无法为下属提供工作的动力。
    • 举例:有个业务需要节省成本,需要要“查询性能提升2倍”。身为主管,自然不能直接告诉下属“查询性能提升2倍”。主管要做的是,考虑怎样才能使性能提升2倍,再用具体的语言指挥下属行动起来。
    • 工作边界要清晰
  • 了解下属的能力和意愿
    • 根据下属能力进行分工,整体分工需要张弛有度,有能提升硬实力的工作也有易产出有亮眼的工作
    • 针对个体而言,重点在于提升能力和个人意愿
    • 针对个体间而言,在于加强分工和协作,分工要有边界
    • 主管的行为一般有:授权型、参与型、说服型、命令型;根据下属不同性格要有不同的行为
  • 激情会传染。做主管的必须先激情四射,然后才能点燃下属们的激情
  • 要掌控业务全貌
  • 技术上能搞事情。能搞定别人解不了的事情,团队影响力越高,团队同学认同感和参与感越强;多思考技术和未来团队发展的事情
  • 提升下属对你的信任度
    • 有一技之长。技术leader某一块技术能力要做到团队最好,影响信服度
    • 能让对方感受到你是真实的帮助其成长,需要更多换位思考
    • 利用好团建和聚餐场合

Read More

Elasticsearch集群JVM coredump问题排查

前言

好几年前的文章了,之前排查问题,随手写的,但是发现其他团队人遇到类似问题没有思路,所以还是发出来,给大家一起解决问题的思路。

问题描述

ES集群磁盘报警,发现/home/coresave/ core文件导致根目录磁盘被打满,删除core文件恢复,已知这个集群新上线了jdk 17 zgc,排查下jvm为啥core。而jvm core一般有以下几个原因:资源超了(内存、线程数,vma数等),jvm bug(比如指令集)

排查过程

先去elasticsearch根目录查看core日志,即hs_err_pid_xxx.log,内容如下:
core日志文件
看core原因是因为资源不足(不一定是内存)导致的问题,jdk 17 zgc core后,fatal error 原因与g1 有明显不同,突然不知道怎么去排查了,研究下,思路如下。资源不足原因我们可以在hs_err.log里查看具体的原因,步骤如下:

1、先排查meminfo,看下机器内存情况

Read More