2020年,过完六月,这一整年就过去了一半。朋友圈里对“2020年过半”这个话题的反应程度一般,没有铺天盖地的“告别过去,迎接未来”的句式。但是对于每个个体来讲,无论是否在朋友圈里发表纪念动态,2020年过半是一个无法篡改的客观事实。
这个季度的目标,朴实无华且枯燥:
- P0
- 会计考试准备 —— 暂停
- 论文第一二三章 —— 已达成
- 论文爬虫 —— 已达成
- P1
- 写博客 —— 进行中
- 学滑板 —— 未开始
- 学口琴 —— 未开始
- P2
- 学日语 —— 未开始
毕业论文和相关的启迪
今年年初,期末结束的时候,班主任跟我们“预警”了今年的重大任务——毕业论文。到今年五月中旬,班主任突然通知大家,在六月底会收集本年度第一次答辩的论文,以便能赶上今年第三季度的论文初筛。通知一下发,同学们都“震惊了”,有很多同学都在微信群里“祈求”老师延期收稿,或者责怪老师之前没有提供详细的日程。
不过我在培养计划里面看到今年大概八月份会进行论文预答辩,所以看到老师宣布收稿并不意外,但心里也有一点慌。早在去年年末的时候,我就已经和学术导师建立了联系,确定了论文的大体方向;今年三月份的时候,就针对论文有了大体的框架,并准备开始学习使用Python写爬虫爬数据。收到班主任计划收稿的消息之后,我大概花了一天的时间来构思论文的大体思路,规划了一下总体上要爬取的数据,并且跟之前项目组负责爬虫的同事打了招呼,希望从他们那里得到一些爬虫建议。
五月底,我就开始了并行的两个任务——第一个是,向负责爬虫的同事请教,要来了基本的爬虫代码,并且把要研究的对象网站的接口翻了个底朝天,把爬虫代码修修改改,满足自己的数据需求;另一个是,拿着上一届学长学姐的优秀论文,以及在CNKI上找了不少的参考资料,开始着手前几章内容的撰写。
爬虫这个事情,真的是难搞,即便是同事“把饭喂到嘴边上”,很多代码细节也要搞明白之后才能改。所以几乎是每天晚上下班之后,我还要自己“亲手”改代码。改代码倒还挺有乐趣的,特别是能让程序跑通。在这个过程中,我学会了读取层层嵌套的json格式的方法,解决了爬虫被封时的异常处理(之前的代码,一旦接口报错,这次进程爬来的数据都会被清空),还学会了使用Cookie等等的header信息绕过爬虫识别的方法……虽然现在看来觉得有点小儿科,但是在当时真的算是伟大了。
优秀论文和参考资料方面,也是一大头疼的问题。我研究的领域,目前很少有做量化研究的,大部分都是停留在“意义分析”上,说白了就是没法用数字说话,全在“意淫”,所以领域内的可参考文献较少;相似领域内的论文倒不少,通读不太可能,就筛选了比较中意的论文,看下目录,读下摘要,把主要的研究方法看一下。在写论文的过程中,对我影响最大的是照着学长学姐的论文“临摹”,各个章节是怎么写的、使用了什么研究方法、采用这种研究方法的原因是什么、输出的结论如何验证稳健性,等等,都是照着学长学姐的论文不断延伸,发现了“解锁新世界大门的钥匙”。
和导师的相处也特别愉快。我的导师在学院里的管理职级比较高,平常会处理很多学院上的事情,很少有合适的时间能和我们会面。我大体拟定了研究方向和方法之后,就和老师约定了一个时间,在学校会了个面。我的导师在互联网营销领域的造诣颇深,整个会谈持续了两三个小时,除了论文的指导,还跟我讨论了现在互联网的营销方法、如何用营销理论解释现在互联网公司的一些做法,还预测了下一个互联网引爆点……
从五月底确定方向,整个六月我都在疯狂写论文。在公司,中午吃完饭之后,抹掉了午休,拉数据、作图、写论文;中间一段时间,爬虫基本稳定之后,会趁着工作闲暇跑一下数据。爬数据可真是一个体力活,五十多万的数据,胆战心惊、断断续续地跑了将近一个星期(其中还不断地被打断、重跑,不短地调整爬虫)。跑完数据,就用各式各样的分析软件跑模型验数据,输出的各种结果我自己都傻了眼了(不太会解读,哈哈)。在这个过程中,我知道什么是共线性问题,该如何解读拟合情况,以前交给统计学老师的东西,突然间又回来了一部分。
最终,我在交稿截止日之前,第一个把论文交了……(我自己都惊呆了)发完邮件的那一刻,有一种感觉——提早交出论文的感觉真好!
在这个过程中,我体会到了几点:
- 学会使用新的思路来考虑问题。我的导师在跟我们交流时提到,已经工作的人读研究生,不仅仅在于获得知识,而且还要学到新的“解题思路”,学术研究或者专业研究中用到的思路和方法,与实际工作相结合,才是读完硕士最好的结果。一篇论文,用三四万字来描述一个现象,解释一个事实,很像是我们在做需求……论文里的背景动机、思路方法、概念和文献综述、理论基础和模型、数据整理、实证分析、结论展望,很像是一个需求要素被发现、推理、印证、落实设计、宣讲(评审)、上线和复盘。(不过我和身边的很多同行都没有办法做出让人足够信服的决策,缺失了很多重要的环节)
- 数据观察的必要性。不论这次论文的研究方法或者思路是否合理,“数据研究”的部分的的确确给人启迪。数据的描述性统计分析、回归分析、独立样本检验,这些本科时候学到的统计知识,都可以有实际应用,在描述现状、解释AB实验等等方面都可以获得应用。如果我们在做决定之前,充分进行足够的数据分析,多个角度了解现状,才有理由充分的立足点;上线数据回收后,记得对数据进行多方位解读,通过简单的统计方法可视化上线效果,并避开常规统计陷阱和误区,才能正常验证决策效果,并为下一步决策提供基础。我在做埋点的工作中,也会提前想到数据应用的情况,提前构想数据观察角度;在和同事一起做AB实验的时候,也尝试使用独立样本检验的方法解读表象数据,这样才让自己所做的这些工作更有价值和意义。
- 纸上得来终觉浅。之前项目组,有一个非常热衷抓取的技术领导,有几个开发同事专注钻研外部数据抓取方法和技术。相当多的同事认为,他们就没有不能完成的抓取需求。有同事跟我解释了背后的心酸,特别是我接触了这次论文的抓取活动之后,更体会到了其中的“酸甜苦辣”——难啊。被爬取方与爬取者之间一直在进行攻防战,我也非常理解开发工程师一夜抓取不了多少数据的那种痛苦。我一直认同与技术合作紧密的产品从业者必须多多少少懂些技术,不是代替开发者和架构师评估开发工作量,也不是先入为主地评判需求的实现难度,而是需要有一种评估需求合理性的意识,也需要有一点交付到下游后实施困难的同理心。
形成的新习惯
上一个季度所坚持的与“牛奶”相关的习惯,这个季度还在坚持,有一段时间纯牛奶要喝到吐,不过现在还好,已经过了那段日子。
“听”有用的信息
自从搬家之后,去公司的路程变得比较短,路上看书也不太现实。有一段时间我在喜马拉雅上听书, 但平台上有一部分是比较口水的内容,觉得没意思。有几个非常喜欢的公众号,每次推送的内容都值得看,但又不想在这么短途的地铁上看,于是——我使用iOS的“屏幕阅读”功能,把公众号的内容以1.5倍速读出来。这样的效果还挺不错,几乎每个工作日,在去地铁站的路上、搭乘地铁时、坐班车时,都会不间断地听内容。
我发现,现在太多的内容不值得被传播、不值得被看。近三个月,我已经摒弃了新浪微博的热搜榜,并因为新浪微博私下“为我”关注了很多奇形怪状的账户,注销了微博;百度的热搜榜也只能看看标题,点开看详情也都是千篇一律的“百家号体”;抖音虽然有一些优质内容,但划屏的动作会让我在上面耗费太多时间,而且吸收内容的效率有限;以前所依赖的即刻App,回归后已经变成了完完整整的社区形态,不值得在这里看资讯。近一段时间清理了一部分感觉“没用”的公众号,筛选了几个自己喜欢的加了星标;保留了几个比较重要的新闻App推送,其余的推送要么设为隐式推送,要么完全屏蔽。
从这方面看来,我认为我们本不需要那么多的信源,也不需要接收那么多信息。没人喜欢一件事情被多个媒体用相同的视角、相同的口吻报道。对于我个人来说,我现在越来越讨厌各式各样的“评论”、“分析”类内容,也逐渐摒弃“解剖式”的文章。太多的人喜欢以上帝视角观察一个项目、一家公司或者一个人,读者喜欢看这样的文章,但实际上这样的分析,除了解释一下现象,几乎没有任何对被分析实体、读者的有益之处,并惯出一部分读者擅长空谈、不善于落地的毛病。公众号文章已经进入“高产时代”,很少有媒体可以用心采访、深度报道,连官媒都要天天“震惊!”、“刚刚!”、“突发!”、“扩散!”,每个人的“紧张阈值”被拔得老高。一些标榜“看到未来”的媒体,相当多的外采文章,都是以“反转式”的标题吸引读者,但内容不能引人思考。所以筛选下来的信源或者常读媒体,一般都足够客观(报道一般以平稳的陈述为特征)、尽可能撇开立场,亦或是针对某个特定的主题进行深度研究。
星标公众号:浪潮工作室(探索看不到的新主题)、燃财经(了解经济、互联网相关的深度报道)、上海发布(了解本市重要消息)、 烯牛数据(创投数据和每日消息汇总)、晚点LatePost(独家一手采访)、丁香医生(关心自己的身体)、caoz的梦呓(个人视角和观点)。
新闻资讯App(主要关注他们的推送):Twitter(订阅了国内对外媒体、日文、英国、美国较大型的媒体)、NHK WORLD(日本放送协会国际频道)、BBC News、無綫新聞(香港无线电视台新闻资讯)。
坚持跑步
另外,在五月份的时候,跑步路上遇到了以为跑步达人,带我解锁了公司旁边的一条非常适合跑步的绿道。自此以后,每个工作日前一天都会看一下天气预报,如果没有雨,就会带上跑步装备,晚饭期间出去跑一遭。
这个季度坚持跑步,带来得比较明显的进步——五公里内平均配速有所长进,并且能够坚持跑下五公里;跑步更加注重姿势和节奏。一到跑步的时候,什么烦恼也没有了,也感觉不到压力了。
至于为什么要坚持跑步,这个大概需要一段时间想明白。一开始做这件事情,是为了让自己寻找一个能够长期坚持且健康向上的习惯,目前看来即将达成这个目标。接下来更希望寻找突破,在各种数值方面寻找增长——或者是单次跑步的里程提高,或者是单程配速的降低,最终能参加十公里跑(当做是今年的一个里程碑)。
工作上的事
经历了2020年第一季度的云端合作之后,我们终于在第二季度能完整地见面合作了。(相信每个公司的半年回顾、Q1回顾、Q2回顾都少不了“新冠疫情”)
Q2发生了很多事情,其中一件便是看到很多同事离开。在这个季度里,之前项目组的产品设计组,因为各种原因走了几个“创始级”同事,开启了新的工作生活;现在在的这个项目组,也因为某些原因,几个同事意外离开,几个同事转组。上个季度印象最深的就是,前一天还在沟通需求的同事,第二天打开聊天软件,就显示了“已离职”,这种情况在年后回来持续了一段时间。
工作上的阻力依然不小。流程上的混乱,导致后台和数据模块(也就是我们小组负责部分)一直处于一种凌乱的状态。不过还好,在进入这个项目组后,把自己手头上的业务现状、逻辑都完整梳理了一遍,特别自豪的是把一个经手四五个团队的主业务频道数据相关的东西整理清楚,常规的业务合作也开始走上正轨。
这个Q,和半个技术产品部门合作了一圈,整体上的合作效率和满意度都挺高。不过有个画外音……运营发现了一个上传渠道的问题,把整个技术产品团队问了个遍,最终的结论是——无人可以解答,相关权限刚移交给新团队,不知来龙去脉。
接下来要做的事
去年年末脑子一热报了一个初级会计考试,是想看看财会领域到底是怎么运行的。年初疫情影响,相关考试推迟或者取消。目前来看,8月份会重新举行考试。
在学习相关知识的过程中,发现了企业运行和国家税务、海关、房地产、制造部门、财务法律相关的运行原理(不过发现真的是复杂),突然理解了财务系统、内部OA以及ERP相关系统设计者的难处。作为难免需要和财务同事打交道的产品同学,了解这些东西,并且能够在对应的规则和场景下输出合理合适的系统方案,的确是正道。
论文写完之后,接下来就是进入漫长且无限循环的修改过程。下个Q的一件大事就是完善论文,在所选定的理论框架下完善问题的解法,从多个角度思考潜在问题并试图解决。
半年内没有出门走走,都快要憋坏了,希望接下来的三个月,有机会离开上海,多去外面走走看看。
最近订阅了职人社的交流分享,希望在接下来三个月中,能够从业内领先的团队、项目中,在不同方面获得新的认知和思考。(我突然觉得,做产品,与其他人交流,关键点不在于强大的方法论,而是像开发者交流一样,重在“最佳实践”)面对现有的工作环境,要么接受,要么改变,要么离开。
一年已过半,这半年好像秋天湖面一样波澜不惊。7月1号依然是一个起点,现在开始使劲造作还来得及。
发表回复