一个典型的技术运用运营工作的案例

相信很多运营及编辑的同学在工作中都会遇到各种文本处理的问题,如这篇文章放哪里?这类内容在什么频道?有过在大型网站工作过的同学肯定会深受其害,很多也是导致各种‘忙成狗’的原因之一,去年腾讯的机器编辑新闻可能大家都不陌生,大家回想以后是不是不需要编辑啦之类的问题,其实一些东西确实是可以通过技术解决的,今天就发现一个通过技术实现文本自动分类的例子

首先几个名字

1自然语言处理

2机器学习

3词向量

感兴趣的同学可以去网上查查相关的名词了解下,对经常与文字打交道的童鞋来说,了解这些技术东西还是非常有必要的。


进入主题

使用的工具

1 Python

2 textgrocery库

不会技术的同学先不要慌,我相信很多同学大学都有学过 c语言,没错 只要您了解基本的编程知识,了解下Python这门语言就够用啦!


还是来讲讲Python的安装吧 这里不给大家详细讲了,直接上一个window系统下安装Python的教程和安装软件一样的简单。

http://jingyan.baidu.com/article/7908e85c78c743af491ad261.html


现在的Python版本都集成的下载(pip install)功能

安装好 Python后 ,打开电脑输入 CMD 按enter打开cmd窗口


输入 pip install tgrocery



到这里你需要的工具都准备完成了


给大家上一段 grocery官方文档的地址

http://textgrocery.readthedocs.io/zh/latest/quick-start.html


重点说下原理



看懂了吗?没错就这么简单

可以预见这段代码的执行后的结果


当然这只是对文章的标题进行分析,

结果肯定不准确,如果想对文章内容进行分析本进行归类的话,其实也不是特别麻烦

现在主流的网站包括今日头条、腾讯、等等都有自己的一套文本分析系统。既没有想象中的那么复杂,当然也没有想象中的那么简单。无非就是两个规程,

1分析文章的内容,

2对1分析出来的结果进行对比匹配,

包括什么栏目啊,相似文章,文章关键词 等等都可以通过这两步搞定。


有空可以再教大家怎么利用技术批量找到大量文章的关键词!


你可能对这些感兴趣
    白纸黑字,从来不止两种颜色
    书中的色彩,你记得几种?
    by 毛毛.G
    1 评论
    55 赞
    15 收藏
      这些立足于品牌资产的创意,想学都学不来丨灵感库
      本文,纯纯就是想让你羡慕嫉妒一下。
      by 毛毛.G
      0 评论
      51 赞
      23 收藏
        第一批用AI做设计的人,把它玩出了多少花样?
        “我用AI完成了创作产能的越级”
        by 秩秩
        4 评论
        72 赞
        36 收藏
          “你上班上得这么要死不活,对得起我十月怀胎戒的酒吗?”
          母亲节别再理所当然地歌颂牺牲了。
          by 鲸鱼鱼鱼鱼子
          6 评论
          62 赞
          24 收藏
            除了一日三餐,我们还能和妈妈聊什么?|灵感手抄本
            by 秩秩
            4 评论
            68 赞
            20 收藏
              把自己重新养育一次的东亚小孩,投入身心灵怀抱|创意笔记03
              时代失落,玄学登场
              by TOPYS.
              7 评论
              84 赞
              46 收藏
                最想听到朋友的一句话是:一起吃饭吧!
                可口可乐太会煽情了
                by 秩秩
                4 评论
                51 赞
                23 收藏
                  四千米的青藏高原,如何孕育出世界级奢侈品牌?|小趋势观察眼
                  by 秩秩
                  2 评论
                  50 赞
                  17 收藏