易截截图软件、单文件、免安装、纯绿色、仅160KB

用PHP实现简单的反向最大匹配中文分词(代码)

类文件wordsplit.class.php:
<?php
/********************************************************************
* DirCMS中文分词类 beta 1.0
* ---------------------------
* begin : 2010-5-11 beta 1.0
* update : 2010-5-11 beta 1.0
* copyright : (C) 2009 DirCMS
* email : uuturn@126.com
* author : 穆红伟 M QQ:251171960
* algorithm : 反向最大匹配算法 【注意:本文件需保存为UTF-8格式】
*
* $Id: wordsplit.class.php,v 1.0.0 2010-5-11 9:14:01 M Exp $
********************************************************************/
class wordsplit
{
public $dicloadtime; // 词典载入时间
public $splitwordstime; // 分词时间
private $starttime; // 分词开始时间
private $splitchar=' '; // 切割符,默认为空格
private $wordsdic=array(); // 词库(为键值为词,值为词频的数组) 本分次尚未用到词频
private $cnnumber='0|1|2|3|4|5|6|7|8|9|+|-|%|.|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z'; // 中文全角字母,数字
private $punctuation= array('\r','\n','\t','`','~','!','@','#','$','%','^','&','*','(',')','-','_','+','=','|','\\','\'','"',';',':','/','?','.','>',',','<','[','{',']','}','·','~','!','@','#','¥','%','……','&','×','(',')','-','——','=','+','\','|','【','{','】','}','‘','“','”',';',':','、','?','。','》',',','《',' ',' '); // 标点符号
private $trimchars=array("▲","△","▼","▽","★","☆","◆","◇","■","□","●","○","⊙","㊣","◎","▂","▁","▃","▄","▅","▆","▇","█","▏","▎","▍","▌","▋","▊","◢","◣","◥","◤","▲","▼","♀","♂","卍","※");
private $resultstr=array(); //分词结果字


相关文档:

PHP 中$_SERVER的参数和用法说明


$_SERVER['PHP_SELF']  #当前正在执行脚本的文件名,与document root相关。
$_SERVER['argv']  #传递给该脚本的参数
$_SERVER['argc']  #包含传递给程序的命令行参数的个数(如果运行在命令行模式)。
$_SERVER['GATEWAY_INTERFACE']  #服务器使用的 CGI 规范的版本。例如,& ......

GyPSii API PHP请求示例

根据GyPSii API提供的操作类和方法,发现请求会失败,返回的是一个bed request。原因其实很简单,但一直没有找到,最终原因是对方提供的host是错误的,没天理。
对方提供的host和uri:
host:http://dev3.gypsii.com/gypsii
uri:http://dev3.gypsii.com/gypsii/xmlservice.cgi
这个host就是错的,应该是:dev3.gypsii.co ......

PHP substr() 函数

转自:http://www.w3school.com.cn/php/func_string_substr.asp
PHP substr() 函数
PHP String 函数
定义和用法
substr() 函数返回字符串的一部分。
语法
substr(string,start,length)
参数描述
string
必需。规定要返回其中一部分的字符串。
start
必需。规定在字符串的何处开始。
正数 - 在字符串的指定位置开 ......
© 2009 ej38.com All Rights Reserved. 关于E健网联系我们 | 站点地图 | 赣ICP备09004571号