Spring Boot + Java爬虫 + 部署到Linux(四、使用WebSocket实现消息推送,并解决websocket中的autowired问题)_gg_yangliyang的博客-程序员秘密

技术标签: 消息推送  爬虫  autowired  websocket  Spring Boot  Spring boot  

    在爬虫的过程中,我们有时需要实时的爬取的过程显示出来。如果采用正常的http协议,只有客户端发送请求,服务器才能做出响应,但是爬虫是在后端跑的,什么时候产生什么信息,没法直接发送给前端。可能我们会想到一个办法,就是后端维护一个缓存信息,然后前端定时的轮询这个信息,并取走显示出来。但是有了websocket,服务器就可以直接向客户端发送信息了。相比轮询有以下优点:

1. 节约带宽。 不停地轮询服务端数据这种方式,使用的是http协议,head信息很大,有效数据占比低, 而使用WebSocket方式,头信息很小,有效数据占比高。
2. 无浪费。 轮询方式有可能轮询10次,才碰到服务端数据更新,那么前9次都白轮询了,因为没有拿到变化的数据。 而WebSocket是由服务器主动回发,来的都是新数据。

3. 实时性,考虑到服务器压力,使用轮询方式不可能很短的时间间隔,否则服务器压力太多,所以轮询时间间隔都比较长,好几秒,设置十几秒。 而WebSocket是由服务器主动推送过来,实时性是最高的。

所以我们就想通过websocket来实现消息的推送功能。在实现的过程中遇到了一个很大的问题,那就是autowired在websocket中失效了。最后各种找,还是在csdn里找到了。

首先呢,要在项目里加上websocket的依赖,在pom.xml的dependencies里加上这个:

<dependency>
    		<groupId>org.springframework.boot</groupId>
    		<artifactId>spring-boot-starter-websocket</artifactId>
		</dependency>

然后开始写websocket的配置类:


import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.web.socket.server.standard.ServerEndpointExporter;

@Configuration
public class WebSocketConfig {
	@Bean
	public ServerEndpointExporter serverEndpointExporter() {
        return new ServerEndpointExporter();//标准配置
    }
//如果不需要autowired,则下面这个函数就不需要了
    @Bean
    public MyEndpointConfigure newConfigure()
    {
        return new MyEndpointConfigure();
    }
}

如果需要在websocket里用到autowired,则还要实现下面这个类MyEndPointConfigure,也就是上面这段代码的第二个函数的返回类型。如果没用到,就别画蛇添足了。

import javax.websocket.server.ServerEndpointConfig;

import org.springframework.beans.BeansException;
import org.springframework.beans.factory.BeanFactory;
import org.springframework.context.ApplicationContext;
import org.springframework.context.ApplicationContextAware;

/**
 * 
 * 
 *这个类的核心就是getEndpointInstance(Class clazz)这个方法。 
   定义了获取类实例是通过ApplicationContext获取。
 *
 *
 */
public class MyEndpointConfigure extends ServerEndpointConfig.Configurator implements ApplicationContextAware
{
    private static volatile BeanFactory context;

    @Override
    public <T> T getEndpointInstance(Class<T> clazz) throws InstantiationException
    {
         return context.getBean(clazz);
    }

    @Override
    public void setApplicationContext(ApplicationContext applicationContext) throws BeansException
    {
        System.out.println("auto load"+this.hashCode());
        MyEndpointConfigure.context = applicationContext;
    }
}

最后呢,实现webscoket的主类:



import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.concurrent.CopyOnWriteArraySet;

import javax.websocket.OnClose;
import javax.websocket.OnError;
import javax.websocket.OnMessage;
import javax.websocket.OnOpen;
import javax.websocket.Session;
import javax.websocket.server.ServerEndpoint;

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;



/**
 * 默认的实现,AutoWired注入失败,猜测是因为@ServerEndpoint管理了,不归spring了
 * 解决方法1:定义一个Config,将其给spring管理
 * 缺点:不是正常的管理。。。
 * 
 *
 */
@Component
@ServerEndpoint(value = "/websocket",configurator=MyEndpointConfigure.class)//如果不需要autowired,则configuator不需要了
//上面的这个value,就相当于我们的websocket服务器地址,客户端通过ws://ip:port/value,就能和服务器建立连接了。
public class MyWebSocket {
	//@Autowired 
	//private  GalleryDAO galleryDAO;
	//@Autowired 
	//private  ImageDAO imageDAO;
	
    //静态变量,用来记录当前在线连接数。应该把它设计成线程安全的。
    private static int onlineCount = 0;

    //concurrent包的线程安全Set,用来存放每个客户端对应的MyWebSocket对象。
    private static CopyOnWriteArraySet<MyWebSocket> webSocketSet = new CopyOnWriteArraySet<MyWebSocket>();

    //与某个客户端的连接会话,需要通过它来给客户端发送数据
    private Session session;

    /**
     * 连接建立成功调用的方法*/
    @OnOpen
    public void onOpen(Session session) {
        this.session = session;
        webSocketSet.add(this);     //加入set中
        addOnlineCount();           //在线数加1
        System.out.println("有新连接加入!当前在线人数为" + getOnlineCount());
        
    }

    /**
     * 连接关闭调用的方法
     */
    @OnClose
    public void onClose() {
        webSocketSet.remove(this);  //从set中删除
        subOnlineCount();           //在线数减1
        System.out.println("有一连接关闭!当前在线人数为" + getOnlineCount());
    }

    /**
     * 收到客户端消息后调用的方法
     *
     * @param message 客户端发送过来的消息
     * @throws IOException */
    @OnMessage
    public void onMessage(String message, Session session)  {
    	//可以在这根据客户端的消息,做一些操作
    }

    /**
     * 发生错误时调用
     */
    @OnError
    public void onError(Session session, Throwable error) {
        System.out.println("发生错误");
        error.printStackTrace();
    }

    public void sendMessage(String message)  {
        try {
			this.session.getBasicRemote().sendText(message);
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
        //this.session.getAsyncRemote().sendText(message);
    }
    public void sendMessage(String message,Session session)  {
        try {
			session.getBasicRemote().sendText(message+"\n");
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
        //this.session.getAsyncRemote().sendText(message);
    }


//    /**
//     * 群发自定义消息
//     * */
//    public static void sendInfo(String message) throws IOException {
//        for (MyWebSocket item : webSocketSet) {
//            try {
//                item.sendMessage(message);
//            } catch (IOException e) {
//                continue;
//            }
//        }
//    }

    public static synchronized int getOnlineCount() {
        return onlineCount;
    }

    public static synchronized void addOnlineCount() {
        MyWebSocket.onlineCount++;
    }

    public static synchronized void subOnlineCount() {
        MyWebSocket.onlineCount--;
    }
    
 
	
}

关于这个autowired的问题,这是其中一个简单的解决方法,但据说不太好。更深入的了解,在springboot中的websocket无法自动注入的,可以参考这篇文章解决springboot websocket无法注入其他类。这篇文章最下面也贴了stackoverflow的相关地址,英语好的可以看看。

websocket在前端要怎么配置呢?下面是javascript的实现代码:需要注意的是这样写一点开网页就会自动建立连接和初始化。也可以写在函数里,来实现点击某个按钮再建立连接。

            var websocket = null;

	    //判断当前浏览器是否支持WebSocket
	    if('WebSocket' in window){
	        
	        init_websocket(websocket);
	    }
	    else{
	        alert('Not support websocket')
	    }
		function init_websocket(websocket){
			websocket = new WebSocket("ws://localhost:8080/websocket");//这个websocket就对应上面的ServerEndPoint的value
                                                  //,host和port则是服务器的host和port,new这个对象,就会建立连接。
			//连接发生错误的回调方法
		    websocket.onerror = function(){
		        //错误处理
		    };

		    //连接成功建立的回调方法
		    websocket.onopen = function(event){
		    	//成功处理
		    }

		    //接收到消息的回调方法
		    websocket.onmessage = function(event){
		        //event.data里面包含了接收到的消息,可以通过js将消息处理、显示出来
		    }

		    //连接关闭的回调方法
		    websocket.onclose = function(){
		        //关闭处理
		    }

		    //监听窗口关闭事件,当窗口关闭时,主动去关闭websocket连接,防止连接还没断开就关闭窗口,server端会抛异常。
		    window.onbeforeunload = function(){
		        websocket.close();
		    }
		}
                function sendmessgae(msg){
                        websocket.send(msg);
                }
服务器的websocket和客户端的websocket是怎么对应的呢?可以看到一些函数(注解)都差不多。其中服务器和客户端的onopen、onclose、onerror都是一一对应的。但是onmessage和 sendmessage,这两个方法是相互对应的,即客户端的sendmessgae,会触发服务器端的onmessage。同理,服务器端的sendMessage也会触发客户端的onMessage。
    通过这两个方法,我们就能相互的传递信息了。通过服务器对客户端实时的发送信息,用户就能实时的看到爬虫的进度了。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gg_yangliyang/article/details/80867102

智能推荐

重构 改善既有代码的设计_yousite1的博客-程序员秘密

经过一个多月的时间,我读完了这本重构的书籍。与其说是读完,不如说是扫完的。因为中间关于重构的手法很多,有很多规则我是没有亲手尝试的,其实也没有这个必要。在这本书中,除了中间部分大量的重构手法之外,作者还在书的前后两部分用大量文字说明如何理解重构和怎样使用重构。说白了,只学会重构的手法只学会了重构的一半都不到,更重要的是融汇贯通重构的思想。需要注意的是,作者是从Java的早起版本开始讲解重构

格式化10T硬盘为ext4_普通网友的博客-程序员秘密

为什么80%的码农都做不了架构师?&gt;&gt;&gt; ...

服务重启后登录本地oracle报错:ORA-12514: TNS: 监听程序当前无法识别连接描述符中请求的服务_naomi_qing的博客-程序员秘密

数据库安装成功之后登录Scott能够登录成功,把监听和实例服务重启之后,登录Scott报错ORA-12514。但是不断的登录,偶尔也能够登录上。解决方法:修改配置文件listener.ora中的配置信息。修改前:SID_LIST_LISTENER =  (SID_LIST =    (SID_DESC =      (SID_NAME = CLRExtProc)   

AWS CloudWatch监控配置_新钛云服的博客-程序员秘密

一、简介1. Amazon CloudWatch简介1.1 CloudWatch简介Amazon CloudWatch 实时监控您的 Amazon Web Services (AWS)...

Mysql问题-net start mysql 时:发生系统错误1067_阝东 一的博客-程序员秘密

MySQL版本:5.7.28操作系统:Win7 32位问题描述:MySQL昨天还正常,今天突然登录不进,1、在命令行输入 net start mysql 时报错:“发生系统错误 1067”。2、在命令行输入 mysql -u root -p 登录mysql,返回”Can’t connect to MySQL server on localhost (10061)” 错误。一、寻找原因:...

CoreMotion框架-iOS设备的核心运动_sky_2016的博客-程序员秘密

我们知道iOS的应用真的太多了,很多应用让我们惊叹不已!!!很多意想不到的应用!比如:1.电子罗盘指南针之类的应用-让我们知道方向。2.运动类型软件-让我们知道我们跑步多少公里。3.社交软件中的摇一摇功能。4.游戏中扮演角色类中根据设备的晃动等进行操作。等等。。而且还有很多应用正在层出不穷的展现再我们面前。其实,他们多半是使用了i

随便推点

GCC编译器一些参数区别(-I -l -L)_gcc -i_Parle的博客-程序员秘密

我们用gcc编译程序时,常常会用到“-I”(大写i),“-L”(大写l),“-l”(小写l)等参数,下面做个记录:例:gcc -o hello hello.c -I/home/hello/include -L/home/hello/lib -lworld上面这句表示在编译hello.c时:-I /home/hello/include,表示将/home/hello/include目录作

Android笔记之manifestPlaceholders_weixin_33858249的博客-程序员秘密

有时根据项目需要,AndroidManifest.xml中的meta-data的值分测试和正式为了能自动地更换meta-data值,就需要用到manifestPlaceholders语法:manifestPlaceholders = [FieldName: FieldValue]示例如下build.gradle (Module: app)apply plugin: 'com...

防止SQL注入总结_weixin_34392435的博客-程序员秘密

1、预编译(占位符)可以很大程度上防止SQL注入  预编译的原理是数据库厂商提供的JAR包中,对参数进行了转义2、mybatis中,能用# 的地方,不用$,因为#是预编译占位符形式,可以防止SQL注入 ORDER BY 后,无法用# ,只能用$,此时,需要代码过滤 有效列 。正确的防御SQL注入:1、使用预编译 一般来说,防御SQL注入的最佳方式,就...

常用Android工具类_Summer_Fighter的博客-程序员秘密

<div class="markdown_views"><p>作者&amp;源码:<a href="https://github.com/l123456789jy/Lazy">https://github.com/l123456789jy/Lazy</a></p>内容说明 工具 描述 AnimationUtils 动画工具类 AppUtils APP相关信息工具类 Ass

Android应用程序的Activity启动过程简要介绍和学习计划_绿疏忽的博客-程序员秘密

Android应用程序的Activity启动过程简要介绍和学习计划

MPB:甘肃省科学院祝英等-药用植物地下茎内生真菌的分离纯化及鉴定_刘永鑫Adam的博客-程序员秘密

为进一步提高《微生物组实验手册》稿件质量,本项目新增大众评审环节。文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见。公众号格式显示略有问题,建议电脑端点击文末阅...

推荐文章

热门文章

相关标签