首   页 首席简介 快乐搜索 产品下载 产品论坛 网络日志  首席风采 合作推广 网站地图 站内搜索
精彩推荐
快乐超级搜索
火速桌面搜索
GSearch
Crusher
GoldMiner
SameFinder
CodeFinder
 
 
 
 
 
当前位置:【产品下载】
快乐超级搜索Build20070408

【本地下载】

快乐超级搜索是一款集桌面搜索、网页搜索、新闻搜索、文档搜索、音乐搜索、软件搜索、论文搜索、国学搜索、词语查询、词典查询、天气查询、列车时刻表查询、航班查询、手机号码归属地查询等功能于一体的综合性桌面元搜索引擎。
 
快乐超级搜索内嵌的桌面搜索采用最先进的索引技术,索引文件一般不超过20M,却实现了文件内容的全文搜索,索引文件大小只有目前市场上已有商用桌面搜索索引文件的2%。
 
快乐超级搜索提供了对搜索结果的翻页浏览,实现了文件记录的打开、删除、复制等操作,提供了多种方便的软件启动方式...

查看详细】 【查看用户对快乐超级搜索的评论、向作者反馈使用感受、报告软件bug

火速桌面搜索Build20060826

【本地下载】

火速桌面搜索(Fast Indexer and Retriever for Explorer ,简称FIRE,由于FIRE在英语中有“火”的意思,故称为火速桌面搜索)是一款对用户本地文件系统和特定文件元信息进行快速索引和检索的工具。

火速桌面搜索通过对文件系统的快速索引实现文件系统的快速检索,实现了文件的分类搜索和复合搜索,并实现了结果文件的分页显示和排序。

火速桌面搜索是完全免费软件,不向用户收取任何费用;火速桌面搜索尊重用户隐私,不收集任何与用户隐私可能有关的信息;火速桌面搜索是真正“纯绿色”软件,提供了完整的卸载功能,软件卸载后不会留下任何可执行代码和注册表配置。

查看详细】【查看用户对火速桌面搜索的评论、向作者反馈使用感受、报告软件bug
GSearch桌面搜索软件--Linux平台第一款桌面搜索软件

【本地下载】

GSearch是Linux平台下第一款快速桌面搜索软件,整合了高效磁盘扫描技术和先进的索引技术,实现对Linux文件系统的快速扫描和索引;GSearch采用最先进的模式匹配算法实现文件内容的快速搜索,既保证了搜索的快速,又不会耗费太多宝贵的硬盘空间和内存空间。

GSearch具有如下特点:
功能强大:支持通配符模糊搜索、精确搜索、复合搜索、文件类型搜索;支持文件内容搜索;

短小精悍:用不到95K的程序完成本地文件系统的快速扫描、高效索引、查询解析、文件检索、结果过滤、结果显示等操作。索引文件 一般不超过30M左右,运行时消耗内存不超过 5M。

开发源码: GSearch 的所有源代码和开发文档都免费向全社会开发,GSearch代码风格优良,注释完整规范,拥有一百多页的分析文档和设计文档,是广大网友学习桌面搜索和信息检索的宝贵资料。

查看详细】【查看用户对GSearch桌面搜索的评论、向作者反馈使用感受、报告软件bug

Crusher---大规模语料重复串发现软件
【非免费软件】 Crusher就是一个能够从大规模语料中挖掘频繁模式的系统,能够在几十G、甚至上T的文本中快速发现重复串。

Crusher 提供了一种语料的完美划分策略,即使语料规模远远大于内存时同样可以高效查找语料的重复串。Crusher的语料划分策略是一种无损划分策略,不会由于语料划分导致重复串的遗漏。

Crusher可以由用户设定待输出重复串的频次阈值,Crusher在查找过程中能够对没有达到阈值的重复串剪枝,从而节省大量的计算代价。

Crusher是一个可扩展的重复串解决方案,当语料规模进一步增大时,Crusher不需要增加内存即可发现所有满足条件的重复串。

Crusher是一个非常适合并行化的解决方案,当有多个节点可用时,Crusher可以将划分后的语料分别放到不同节点运行,分别发现各子语料的重复串,其并集就是原始语料的重复串。各子语料的处理可以完全独立。

查看详细】【查看用户对Crusher的评论、向作者反馈使用感受、报告软件bug

SameFinder--短文本快速去重软件

【非免费软件】

SameFinder能够对几千万短文本在几十秒的时间内去除所有重复,并统计每个短文本的频次。

本软件不需要费时的字符串操作,速度非常快。对1200万条长度为120字节的短文语料做查重,只需要44秒。

查看详细】【查看用户对SameFinder的评论、向作者反馈使用感受、报告软件bug

GoldMiner--海量语料有意义串发现软件

【 本地下载】

在互联网高度发达的今天,网络用语日新月异,产生了大量新的词语和短语。在日常生活中也时时会产生数量巨大的新的用语,如“非典”、“神六”等。在在线聊天室、即时通讯、手机短信中也有大量非正规表达方式,如“886”、“3ks“等。发现这些汹涌而来的有意义串对于把握时代脉搏,实时抓住商机都有重要意义。

GoldMiner就是一款从语料中发现有意义串的软件。GoldMiner通过分析字符串的出现频次、串的构成成分、串的上下文环境、串间的语义相似度等,从而甑别出有意义的字符串。 本次发布的GoldMiner V1.0版随软件还赠送三个生语料:曹雪芹的《红楼梦》、金庸的《神雕英雄传》和古龙的《绝代双骄》。用户若需要更多的自然语言处理语料,也可以与龚才春博士联系。

查看详细】【查看用户对GoldMiner的评论、向作者反馈使用感受、报告软件bug

CodeFinder--文本流快速编码识别与语种识别软件
【非免费软件】 由于历史和地域等多方面的原因,汉字字符在计算机存储和处理时有多种编码形式,常用的有GB码系列、BIG5码系列、UNICODE码系列等。编码识别的错误会导致后续处理的错误,如显示为乱码等。

已有关于编码识别的方法都只对长文本有效,同时当训练语料和测试语料领域差别较大时,识别准确率比较低。对于实时的文本流几乎无能为力。

CodeFinder采用龚才春博士获得专利的编码识别方法,对500万条BBS标题语料的测试结果表明,对于长度超过10字符的文本,几乎都能正确识别编码形式,90%以上的文本只需要5个字符就可以正确识别编码形式,识别500万文本的编码形式耗时仅仅16秒。

查看详细】【查看用户对CodeFinder的评论、向作者反馈使用感受、报告软件bug

小神仙电子词典beta版
【本地下载】 小神仙电子词典由中科院计算技术研究所龚才春博士设计,词典中所有词条采用了Scott Wordlist,单词的所有释义采用HTTP协议从百度词典搜索获取,从采集过来的网页中抽取释义部分显示出来。

小神仙电子词典本身并不存在任何单词的释义,对ScottWordlist采用了加密处理。小神仙电子词典的开发得到中科院软件所林品博士的大力支持,特此表示感谢!

查看详细

龚才春个人信息网     Email:gongcaichun@gmail.com     MSN:gongcaichun@hotmail.com     京ICP备07016545号
Copyright (C) 2007 GONG Caichun, All rights reserved. 未经授权,不得复制、转载、摘要或建立镜像,如有违反,追究法律责任.