mysql正则替换开始了
边测试边写,因为发现采集的内容中有<script>里面内容不一定知道!所以想到正则这个无所不在的东西!
上面找出的记录 960条!
在经过下面两组sql的测试,
找出结果 960条!
说明正则是对的!
现在要替换!
以前的在 blog说过mysql 的replace功能,现在把replace和 regexp结合起来! 然后update一下
可是在mysql里面没有,
这里找mysql的兄弟来帮忙
$pattern1='/<script[^>]*?>.*?<\/script>/si';
foreach($list as $lst)
{
$UpdateSQL = sprintf("UPDATE ".TAB."news SET `content`= %s where `id`= %s ",
GetSQLValueString(preg_replace($pattern1, '', $lst['content']) ,"text"),
GetSQLValueString($lst['id'],"int"));
echo $db->query($UpdateSQL);
}
这样就可以把里面的js 都给拿了!
这个是对于尾部的处理!
SELECT id,content from cuku_news where content REGEXP '<script type=\"text\/javascript\">.*<\/script>' order by id desc
上面找出的记录 960条!
在经过下面两组sql的测试,
SELECT id,content from cuku_news where content like '%</script>%' order by id desc
SELECT id,content from cuku_news where content like '%<script%' order by id desc
SELECT id,content from cuku_news where content like '%<script%' order by id desc
找出结果 960条!
说明正则是对的!
现在要替换!
以前的在 blog说过mysql 的replace功能,现在把replace和 regexp结合起来! 然后update一下
可是在mysql里面没有,
这里找mysql的兄弟来帮忙
$pattern1='/<script[^>]*?>.*?<\/script>/si';
foreach($list as $lst)
{
$UpdateSQL = sprintf("UPDATE ".TAB."news SET `content`= %s where `id`= %s ",
GetSQLValueString(preg_replace($pattern1, '', $lst['content']) ,"text"),
GetSQLValueString($lst['id'],"int"));
echo $db->query($UpdateSQL);
}
这样就可以把里面的js 都给拿了!
select substr(pid,1,LOCATE(',',pid)-1) as pid from cuku_newscat
这个是对于尾部的处理!
业务不熟,sitemap写错
广东质检从03年到现在,打假69件今年还没打假
