我是最近一两年才意识到因为字节跳动在女性议题上微微唱了一些高调,似乎在不少人心中的形象比阿里腾讯拼XX华为还要好一点,而且因为它出海比较成功,觉得它形象fashion。
emm,怎么讲呢,字节是国内大厂里我印象最糟糕的,因为创始人从一开始的出发点就是:让我们给下等人们生产一点奶头乐,赚它们的钱。它可能不特别歧视女性(不是说不歧视),而是歧视所有它认为的“下等人”,觉得你们只配吃我算法调配出来的馊水,不配拥有哪怕好一点的精神享受。
昨天晚上激情写了个小程序,读取原版小说文本,用nltk库找到原词(去复数和时态),统计词频。把特别高频肯定认识的词干掉,把只出现过一次的词也干掉。再和美国当代英语语料库COCA的20000常用词比对,基本上一本小说只剩下不到1000的生词。
把这个词表导入欧陆的生词本稍微扫一遍,可以极大提升阅读原版小说时的体验。
最近Google发各种产品协议更新/冻结用户条款/限制容量的邮件之频繁,总让我脑海里不自觉响起“江南皮革厂倒闭了,王八蛋老板吃喝嫖赌欠下三点五个亿,带着他的小姨子跑了”的声音🔊