V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐工具
RoboMongo
推荐书目
50 Tips and Tricks for MongoDB Developers
Related Blogs
Snail in a Turtleneck
ooh
V2EX  ›  MongoDB

求 MongoDB 全文搜索思路指导。

  •  
  •   ooh · 2014-03-16 22:26:30 +08:00 · 6244 次点击
    这是一个创建于 3940 天前的主题,其中的信息可能已经有所发展或是发生改变。
    数据已经接近700w,在100w的时候只是对标题进行检索就是很让人难以接受的了,为了提供更好的搜索体验,同时也要对内容进行检索,恩,要上全文搜索。以前没接触过,但是听说过sphinx,最近一次在面试的时候,也有提到solr。
    我寻思如果能用sphinx,当然最好,但是了解了一下,sphinx对中文支持不是很好;好了来到coreseek,但是我看了一下版本有点老了,这点有点忧虑;最后了解了一下solr,看样子很复杂,要格外装的东西略多。
    好了,接触一个新的领域,出现选择困难症状了,上面三个无论选择那个无疑都能轻松的搞定我的问题,但是,想来学一个新的东西,肯定要选个易学易用的,这方面的资料有点匮乏,想让大家给我出出主意,谢谢。
    语言用的Python,数据更新不是很频繁,可能也就一天更新一次或一周更新一次。
    第 1 条附言  ·  2014-03-20 11:46:26 +08:00
    最终选择了solr:简单粗暴,中文支持很好,分词插件配置也比较简单,自动补全很好用。
    安装的东西略多,JDK,Tomcat...但是配置过一次就比较简单啦
    返回的数据处理起来感觉有点麻烦
    不过用上全文搜索速度不是上了一两个档次
    腰也不疼了,上楼也有劲了,感谢上次面试让我了解了这方面的知识,充分说明有空要去多面试
    9 条回复    2014-05-04 23:00:51 +08:00
    hpxl
        1
    hpxl  
       2014-03-16 22:29:38 +08:00   ❤️ 1
    可以用Xunsearch实现,支持php sdk。http://www.xunsearch.com
    chloerei
        2
    chloerei  
       2014-03-16 22:30:09 +08:00   ❤️ 3
    chol
        3
    chol  
       2014-03-16 23:16:48 +08:00   ❤️ 1
    ElasticSearch 10亿没问题,我们做过全面的测试;专门做全文检索的,和关系型数据库、NoSQL的衍生品根本不在一个数量级上
    ooh
        4
    ooh  
    OP
       2014-03-16 23:25:03 +08:00
    @hpxl
    @chloerei
    @chol
    脑袋瓜已经不够用了。。。
    humiaozuzu
        5
    humiaozuzu  
       2014-03-20 12:06:42 +08:00
    ElasticSearch +1
    ooh
        6
    ooh  
    OP
       2014-03-20 12:13:34 +08:00
    @humiaozuzu 听说很耗内存,高富帅产品是真的吗,只是找了个满足需求入门比较简单的。
    humiaozuzu
        7
    humiaozuzu  
       2014-03-20 12:19:07 +08:00
    @ooh 点头,java的都烧内存。。。
    notnumb
        8
    notnumb  
       2014-03-20 17:54:48 +08:00
    同样的硬件,如果软件优化方面都是一个水平,不会某个特别快,某个特别慢。重要看场景。
    不要抱怨mysql的fsync慢。fsync考虑的是操作的可靠性。
    重要是看你自己的需求就是需不需要mongodb或者是ElasticSearch某些特性。
    偏激的吹嘘ElasticSearch,只能说明盲目而已。
    captain234
        9
    captain234  
       2014-05-04 23:00:51 +08:00
    mongo 2.6已经支持全文索引了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2889 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 13:10 · PVG 21:10 · LAX 05:10 · JFK 08:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.