这两天做了一个功能,需要将抓取到的网页html中的文本按格式显示在richtextbox中。可是richtextbox不识别html标签。本打算自己写个html解释器,但是需要花费时间太多了。既然是个小功能还是找个捷径吧。想了两种办法。

1、不用richtextbox了,直接用webbrowser显示。
既然richtextbox不识别html,WebBrowser总该识别吧。用WebBrowser替换掉richtextbox吧。

string testString = @"  

测试内容:

    哈哈       

    吃饭啦
     下班啦   
     回家
     睡觉     

呵呵呵

神马

 

 

"; webBrowser1.DocumentText = testString; //不过似乎保险一点再加两句 webBrowser1.Document.Write(testString); webBrowser1.Refresh();

2、由于一些原因必须要richtextbox显示。

既然这样就只好用个不伦不类的方法吧。还是利用WebBrowser。

string testString = @"  

测试内容:

    哈哈       

    吃饭啦
     下班啦   
     回家
     睡觉     

呵呵呵

神马

 

 

"; using (WebBrowser webBrowser = new WebBrowser()) { webBrowser.Visible = false; webBrowser.DocumentText = testString; webBrowser.Document.Write(testString); this.richTextBox1.Text = webBrowser.Document.Body.OuterText; }

这样可以将纯文本内容取到,进行单独处理和应用在别的地方就方便了。

这样结果如下:

说明:

1、这里之所以用webBrowser.Document.Write,因为只是 webBrowser.DocumentText = testString的话,webBrowser.Document.Body就是null,没法去文本;
2、过程有些慢;
3、只能处理文本。