易截截图软件、单文件、免安装、纯绿色、仅160KB

用PHP实现简单的反向最大匹配中文分词(代码)

类文件wordsplit.class.php:
<?php
/********************************************************************
* DirCMS中文分词类 beta 1.0
* ---------------------------
* begin : 2010-5-11 beta 1.0
* update : 2010-5-11 beta 1.0
* copyright : (C) 2009 DirCMS
* email : uuturn@126.com
* author : 穆红伟 M QQ:251171960
* algorithm : 反向最大匹配算法 【注意:本文件需保存为UTF-8格式】
*
* $Id: wordsplit.class.php,v 1.0.0 2010-5-11 9:14:01 M Exp $
********************************************************************/
class wordsplit
{
public $dicloadtime; // 词典载入时间
public $splitwordstime; // 分词时间
private $starttime; // 分词开始时间
private $splitchar=' '; // 切割符,默认为空格
private $wordsdic=array(); // 词库(为键值为词,值为词频的数组) 本分次尚未用到词频
private $cnnumber='0|1|2|3|4|5|6|7|8|9|+|-|%|.|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z'; // 中文全角字母,数字
private $punctuation= array('\r','\n','\t','`','~','!','@','#','$','%','^','&','*','(',')','-','_','+','=','|','\\','\'','"',';',':','/','?','.','>',',','<','[','{',']','}','·','~','!','@','#','¥','%','……','&','×','(',')','-','——','=','+','\','|','【','{','】','}','‘','“','”',';',':','、','?','。','》',',','《',' ',' '); // 标点符号
private $trimchars=array("▲","△","▼","▽","★","☆","◆","◇","■","□","●","○","⊙","㊣","◎","▂","▁","▃","▄","▅","▆","▇","█","▏","▎","▍","▌","▋","▊","◢","◣","◥","◤","▲","▼","♀","♂","卍","※");
private $resultstr=array(); //分词结果字


相关文档:

PHP 并发控制样例(转)

值得参考一下该程序设计的思路:
[文章作者:张宴 本文版本:v1.0 最后修改:2007.11.16 转载请注明出处:http://blog.s135.com]
  最近遇到一个问题,Linux下的PHP命令行程序作为守护进程,需要从队列文件中读一行数据,通过TCP协议发送给外地的接收服务器,再读下一行数据,再发送。当本地与外地的网络状况不好时,有 ......

我的php之旅

    不知从什么时候迷恋上了php,在朦胧之中开始了我的编程之路.......
    听说csdn高手如云,很想结识志同道合的朋友,无兄弟不编程,希望大家一起开拓我们的前程,编程之路,不再孤单前行!
    成功之路弯曲而漫长,相信不屈不挠的努力,相信年轻,胜利一定属于我们,加 ......

PHP学习笔记

// 连接两个字符串
<?php
    $txt1 = "Hello";
    $txt2 = "PHP";
    echo $txt1." ".$txt2;
?>
// 取得字符串中的字符数
<?php
    $txt1 = "Abc";
    echo strlen($txt1);
......

GyPSii API PHP请求示例

根据GyPSii API提供的操作类和方法,发现请求会失败,返回的是一个bed request。原因其实很简单,但一直没有找到,最终原因是对方提供的host是错误的,没天理。
对方提供的host和uri:
host:http://dev3.gypsii.com/gypsii
uri:http://dev3.gypsii.com/gypsii/xmlservice.cgi
这个host就是错的,应该是:dev3.gypsii.co ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号