如何成为一名靠谱的职场人

2024-10-11

带团队几年后，很容易快速判断一个同学是否靠谱。那什么是靠谱？即你把一个事情交给一个人后，完全不用操心后续，因为你知道他肯定能落实，就算中间有困难，他也会及时给与你反馈，然后一起协商后续应该如何快速解决此问题。如果靠谱度需要分级的话，我会将其分为三层：做完、做好、做到极致。但是靠谱度是可以培养的，我认为做好以下几点就基本可以胜出了。

1、能拿结果

即做事情要站在结果的角度去考虑和解决问题，以终为始，从目标开始考虑需要什么条件，然后主动想办法去创造条件从而达成问题的解决。但是不要把“过程导向”和“结果导向”对立起来二选一，实际上在职场中，结果导向并不意味着不重视过程，恰恰相反，而是要用以终为始的心态，带着清晰的目标，善用3W分析法，去开启和推进做事情的过程。

2、具备闭环思维

简单来说就是“凡事有计划，约定必落实，问题早知会，及时报进程，事后须反馈”。闭环思维的培养需要多使用PDCA法则指导自己。

如何打造一个高绩效团队

2024-05-22

目标设定

目标透视镜

看大环境

看行业：政治、经济、社会、技术，导致的行业规模变化
看公司：行业竞争导致的公司战略变化
看业务线：根据公司战略看业务导向变化

看小环境

事业群/部目标和上级目标
内/外部客户和资源方需求
本岗位要求和自身发展需求

主抓工作

三大主抓工作
里程碑
助力/阻力

目标设定的原则（SMART原则）

Specific=明确的，清晰的
Measurable=具体、量化、可衡量
Achievable=可达成并具有挑战性
Relevant=有相关性、实际可行
Time bound=有完成时限

Elasticsearch 在滴滴的应用与实践

2024-05-14

滴滴 Elasticsearch 简介

简介

Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 接口的全文搜索引擎，其每个字段均可被索引，且能够横向扩展至数以百计的服务器存储以及处理 TB 级的数据，其可以在极短的时间内存储、搜索和分析大量的数据。

滴滴 ES 发展至今，承接了公司绝大部分端上文本检索、少部分日志场景和向量检索场景，包括地图 POI 检索、订单检索、客服、内搜及把脉日志 ELK 场景等。滴滴 ES 在2020年由2.X升级到7.6.0，近几年围绕保稳定、控成本、提效能和优生态这几个方向持续探索和改进，本文会围绕这几个方向展开介绍。

架构

读《技术管理实战36讲》

2024-05-06

一、管理方法论和角色认知

1.管理方法论

2.角色转换

滴滴基于 Clickhouse 构建新一代日志存储系统

2024-03-05

背景

此前，滴滴日志主要存储于 ES 中。然而，ES 的分词、倒排和正排等功能导致其写入吞吐量存在明显瓶颈。此外，ES 需要存储原始文本、倒排索引和正排索引，这增加了存储成本，并对内存有较高要求。随着滴滴数据量的不断增长，ES 的性能已无法满足当前需求。

在追求降低成本和提高效率的背景下，我们开始寻求新的存储解决方案。经过研究，我们决定采用 CK 作为滴滴内部日志的存储支持。据了解，京东、携程、B站等多家公司在业界的实践中也在尝试用 CK 构建日志存储系统。

挑战

面临的挑战主要来自下面三个方面：

数据量大：每天会产生 PB 级别的日志数据，存储系统需要稳定地支撑 PB 级数据的实时写入和存储。
查询场景多：在一个时间段内的等值查询、模糊查询及排序场景等，查询需要扫描的数据量较大且查询都需要在秒级返回。
QPS 高：在 PB 级的数据量下，对 Trace 查询同时要满足高 QPS 的要求。

为什么选 Clickhouse

大数据量：CK 的分布式架构支持动态扩缩容，可支撑海量数据存储。
写入性能：CK 的 MergeTree 表的写入速度在200MB/s，具有很高吞吐，写入基本没有瓶颈。
查询性能：CK 支持分区索引和排序索引，具有很高的检索效率，单机每秒可扫描数百万行的数据。
存储成本：CK 基于列式存储，数据压缩比很高，同时基于HDFS做冷热分离，能够进一步地降低存储成本。

架构升级

关于做好技术团队管理的几点心得

2024-01-17

技术Leader核心工作是让团队拿更好的成绩，日常工作主要是制定方案、推进业务、掌控下属、协助领导等四项内容，本次分享主要分享最基础也是最重要的管理职责：

调动团队同学的工作积极性
让团队同学更高更快的成长

1、如何调动团队同学的工作积极性？

精确的指示。需要更强调为什么做和这么做的意义，没有计划和目的的命令无法为下属提供工作的动力。
- 举例：有个业务需要节省成本，需要要“查询性能提升2倍”。身为主管，自然不能直接告诉下属“查询性能提升2倍”。主管要做的是，考虑怎样才能使性能提升2倍，再用具体的语言指挥下属行动起来。
- 工作边界要清晰
了解下属的能力和意愿
- 根据下属能力进行分工，整体分工需要张弛有度，有能提升硬实力的工作也有易产出有亮眼的工作
- 针对个体而言，重点在于提升能力和个人意愿
- 针对个体间而言，在于加强分工和协作，分工要有边界
- 主管的行为一般有：授权型、参与型、说服型、命令型；根据下属不同性格要有不同的行为
激情会传染。做主管的必须先激情四射，然后才能点燃下属们的激情
要掌控业务全貌
技术上能搞事情。能搞定别人解不了的事情，团队影响力越高，团队同学认同感和参与感越强；多思考技术和未来团队发展的事情
提升下属对你的信任度
- 有一技之长。技术leader某一块技术能力要做到团队最好，影响信服度
- 能让对方感受到你是真实的帮助其成长，需要更多换位思考
- 利用好团建和聚餐场合

Elasticsearch集群JVM coredump问题排查

2023-12-06

前言

好几年前的文章了，之前排查问题，随手写的，但是发现其他团队人遇到类似问题没有思路，所以还是发出来，给大家一起解决问题的思路。

问题描述

ES集群磁盘报警，发现/home/coresave/ core文件导致根目录磁盘被打满，删除core文件恢复，已知这个集群新上线了jdk 17 zgc，排查下jvm为啥core。而jvm core一般有以下几个原因：资源超了（内存、线程数，vma数等），jvm bug（比如指令集）

排查过程

先去elasticsearch根目录查看core日志，即hs_err_pid_xxx.log，内容如下：
core日志文件
看core原因是因为资源不足（不一定是内存）导致的问题，jdk 17 zgc core后，fatal error 原因与g1 有明显不同，突然不知道怎么去排查了，研究下，思路如下。资源不足原因我们可以在hs_err.log里查看具体的原因，步骤如下：

1、先排查meminfo，看下机器内存情况