FTPHP Beta2 可定制的高性能 web 站内全文检索应用解决方案

首页   功能特色   服务支持   典型案例   SCWS分词  论坛   关于   FAQ  

基于FTPHP的新一代产品Xungle(迅狗网)已经开始公测,
支持Discuz/PHPWind/PHPCMS/Dedecms/HDwiki 等流行WEB应用免费全文搜索,请关注!!

  FTPHP 全文检索系统的核心功能是实现对中小型规模数据量站点信息的统一全文检索。全文检索是指在“海量”信息中快速、准确根据关键词句返回用户所需的信息。

  FTPHP 不仅追求高准确率同时追求超高查全率的手段,内部采用自主研发的 SCWS 复方词法分析系统。搜索结果可以按字段值或信息相关性排序,多字段联合搜索,基于字段的层级命中数量估算,支持字段数值的区间搜索,支持大量的布尔搜索语法规则。

  FTPHP 它还是一个可完全定制的全文检索解决方案套件,底层采用 C、C++ 编写,前台和接口(API)调用采用 PHP 编写,运行在 Linux/BSD 等 Unix 类操作系统中。

架构图

  适合具备独立服务器(需要Unix 类操作系统)的初、中型规模的网站,作为完整站内全文检索技术解决方案。含各种行业垂直搜索、各类BBS系统、各类CMS站点系统等等。

  根据FTPHP 的特点,它可以提供各种搜索功能定制服务,工期短见效快,现有的数据库索引模块、图片搜索、铃声搜索、企业级的站内搜索、计算机文件搜索等,也包括各种专业搜索引擎(如购物搜索,旅游搜索、游戏搜索)、竞争情报搜索、行业搜索、知识管理等等系统的搜索定制。

  典型的如 discuz、phpwind、phpcms 等系统,均没有实现真正全文检索,当数据量达到十万甚至百万以上级别时搜索就成了一个障碍,需要类似 FTPHP 这样的方案来解决。

  1. 投入少,见效快;不需要大量昂贵的“服务器群”“服务器组”,只要至少提供一台可以用的 Unix 类操作系统服务器即可,这台服务器不需专有,不会引起其它冲突。

  2. 开发周期极短,丰富的开发经验与开发实例工具,可以最快的速度为客户提供服务;

  3. Unix 类的运行环境效率和稳定性十分优异;

  4. C/C++ 作为底层开发让为核心效率提供强有力的保证;

  5. PHP 的前台应用快速方便,PHP 已经成为目前最受欢迎的 web 应用编程语言之一;

  6. 良好的数据同步接口API及开发指南;

  7. 自行研发的中文分词系统,无缝的兼容到自己的搜索系统中;

  8. 与大型搜索引擎(如:Google、百度等)所提供的站内搜索引擎(site:domain.com)相比较,它们的缺陷明显(内容不准确干扰词汇多、更新不及时、数据不全);

  9. Lucene (Java) 相比较,lucene 是一套优秀的开源的搜索引擎库,但它只是一个开发库,具体的应用需要二次开发与设计,并且只能运行在 Java 环境中,目前也没较好的中文分词实现。

  操作系统:FreeBSD 6.1 或 Linux 2.4内核及以上版本或其它UNIX类操作系统;

  内存:建议512M以上;

  硬盘:scsi 或 sas 做 raid5 阵列尤佳;

  原软件开发语言:PHP Java .NET 均可。




(C)opyright 2007, 2008, 2009, Powered by FTPHP | 浙ICP备08002718号