Docker容器常见故障排查及处理.docx
《Docker容器常见故障排查及处理.docx》由会员分享,可在线阅读,更多相关《Docker容器常见故障排查及处理.docx(24页珍藏版)》请在三一办公上搜索。
1、近年来,以Docker和kubernetes为代表的容器技术日新月异,但我们在容器的使用过程中,也会碰到各种困扰和难题。本文针对DoCker容器部署、维护过程中,产生的问题和故障,做出有针对性的说明和解决方案,希望可以帮助到大家去快速定位和解决类似问题故障。Docker是一种相对使用较简单的容器,我们可以通过以下几种方式获取信息:1通过dockerrun执行命令,或许返回信息2、通过dockerlogs去获取日志,做有针对性的筛选3、通过Systemctlstatusdocker查看docker服务状态4、通过journalctl-udocker.service查看日志以下是整理的docker
2、容器类问题故障,分为9个类一、启动类故障1docker:CannotconnecttotheDockerdaemonatunixvarrundocker.sock.Isthedockerdaemonrunning?原因:DOCkeI未正常启动解决方式:Systemctlstartdocker2、can,tcreateunixsocketvarrundocker.sock:isadirectory原因:docker.sock不能创建解决方式:rm-rfvarrundocker.sock然后重新启动docker3、Jobfordocker.servicefailed.FailedtostartDo
3、ckerApplicationdocker.service:mainprocessexited,.REFa1edtoStartDOCkerAPC1XCatOnCOUnitdocker.serviceenteredfailedstate.原因:Selinux引起解决方式:etcsysconfig/selinux,把selinux值改为disabled重启docker解决4、docker:ErrorresponsefromdaemonvarlibdockeroverlayXXXXXXXXXXXXXXXXXXXXXXX:nosuchfileordirectory.原因:docker没有指定目录或文件
4、解决方式:Systemctlstopdockerrm-rfvarlibdocker*systemctlstartdocker重启run镜像启动容器5、docker:Errorresponsefromdaemon:Conflict.ThecontainernameXXXisalreadyinusebycontainerXXXn.Youhavetoremove(orrename)thatcontainertobeabletoreusethatname.原因:dockername重名解决方式:改名容器或者删除重建容器6、Error:Connectionactivationfailed:Nosuita
5、bledevicefoundforthisconnection原因:网卡配置问题解决方式:重启网卡7、系统重启后docker无法启动报错为:dockerO:iptables:Nochain/target/matchbythatname原因:docker服务iptables问题解决方式:重启docker服务systemrestartdocker8、Errorstartingdaemon:errorinitializinggraphdriver:drivernotsupported使用OVerIay2存储驱动启动dockerdaemon报错原因:daemon缺少配置解决方式:添加配置:etcdoc
6、kerdaemon.jsonstorage-driver:overlay2,storage-opts:overlay2.override-kernel-check=truen)9、Failedtostartdocker.service:Unitdocker.serviceismasked.未知原因:docker被mask解决方式:Systemctlunmaskdocker.Servicesystemctlunmaskdocker.socketsystemctlstartocker.service10Failedtostartdocker.service:Unitisnotloadedprope
7、rly:Invalidargument,etcsystemdsystemdocker.service:1Assignmentoutsideofsection.Ignoring.docker.servicelacksbothExecStart=andExecStop=setting.Refusing.未知原因:docker服务无法正常load解决方式:卸载docker,删除docker.service重新安装docker11docker-compose启动容器时报错:usrlibpython2.7site-packagesrequests/init.py:80:RequestsDependenc
8、yWarning:urllib3(1.22)orchardet(2.2.1)doesntmatchasupportedversion!RequestsDependencyWarning)未知原因:PiP相应组件版本不支持解决方式:pipuninstallurllib3pipuninstallchardetpipinstallrequests12docker容器重启故障强杀docker进程后,重启dockerodocker中的容器无法启动并报错dockerrestartXXXXXXXErrorresponsefromdaemon:CannotrestartcontainerXXXXXXX:con
9、tainerXXXXXXXXXXXXXXXXm:alreadyexists原因:旧容器未安全退出解决方式:docker-containerd-ctraddressrundockercontainerddocker-containerd.socknamespacecrmdockerstart容器13、docker重启错误-重启命令一直卡住Systemctlrestartdocker卡住未知原因:可能是启动的容器数量过多,或者磁盘IO问题解决方式:Systemctlstartdocker-cleanup.servicesystemctlstartdocker二、权限问题报错14Gotpermiss
10、iondeniedwhiletryingtoconnecttotheDockerdaemonsocketatUniX:varrundocker.sock解决方式:查看varrundocker.sock所在用户组将用户重新加入docker组中,usermod-aGdocker$USER15、chownsocketatstepGROUP:Nosuchprocess::FailedtochownsocketatstepGROUP:Nosuchprocessdocker,socketntrolprocessexited,code=exitedstatus=:FailedtolistenonDocker
11、SocketfortheAPI.原因:docker无法找到GroUP组信息,docker组有可能被误删除解决方式:groupadddocker16原因:非ROot用户管理DOCkeI时,权限不足解决方式:groupadddockerusennod-a-Gdockeruser17、dockercommit镜像时报错Errorprocessingtarfile(exitstatus1):unexpectedEOF原因:可能是权限问题引起解决方式:chmod+x加一个执行权限三、镜像和仓库问题报错18、原因:DOCker仓库无法访问解决方式:修改Docker仓库源为国内或者自建的仓库源修改etcdo
12、ckerdaemon.json19、推送本地镜像报错ThepushreferstoarepositoryXXXXGet原因:dockerregistry未采用https服务所致解决方式:etcdockerdaemon.json文件写入:insecure-registries:)20usrbindocker-current:Errorresponsefromdaemon:ociruntimeerror:container_linux.go:startingcontainerprocesscaused,exec:7binbash:executablefilenotfoundin$PATH.原因:D
13、OCker镜像自身问题或者DOCker引擎版本比较低导致解决方式:可以升级DOCker版本服务21、构建镜像,执行ChoWn-R非常慢原因:DOCker使用写时复制策略,所以ChOWn命令执行时,会将上层镜像文件全部复制到当前层,然后再修改权限,再写入文件系统。解决方式:不应该使用ChoWn-R这类大批量修改文件的命令22、dockerbuild构建镜像的时候报错:Messagefromsyslogdkernel:unregister_netdevice:waitingforIotobecomefree.Usagecount=1原因:dockerengine版本过高解决方式:dockereng
14、ine版本需要和docker内部镜像的内核版本匹配23、docker:Errorresponsefromdaemon:containerd:containerdidnotstartbeforethespecifiedtime-out.ERRO0133errorgettingeventsfromdaemon:contextcanceled原因:修改完dockerrootdir,重启后,下载镜像报错解决方式:重启docker服务或者重启服务器四、资源问题报错25、Dockernospaceleftondevice原因:空间不足解决方式:清理空间,删除未被使用的容器,镜像等资源dockersyste
15、mprune-a26varlibdockercontainers占用过大原因:日志文件占用过大解决方式:catdevnull*-json.log或者增加dockerd启动参数ZetcZdockerZdaemon.json,log-driver:json-file,log-opts:,max-size,2G,max-file,10n27maxvirtualmemoryareasvm.max_map_count165530istoolow,increasetoatleast(262144原因:系统参数默认配置过小解决方式:修改etcsysctl.conf里面的Vm.maxnap_count调大28
16、Gotstartingcontainerprocesscausedprocess_linux.go:301:runningexecsetnsprocessforinitcausedexitstatus40:unknown.fromtimetotime原因:可能是CaChe问题引起解决方式:echo1/proc/sys/vm/drop_caches29、docker本机启动多台容器导致出现后续容器启动失败原因:查看硬盘空间是否满,如果不是硬盘空间问题引起解决方式:vimZetcZsysctLconf添加参数fs.aio-max-nr=1048576sysctl-p30DOCker启动异常,状态反
17、复restartingReStarting(1)LessthanaSeeondagoDockerlogs容器名,查看异常日志查varlogmessageskernel:Outofmemory:Killprocess2814Ei(java)score52orsacrificechildkernel:Outofmemory:Killprocess2976(java)score54orsacrificechildkernel:Outofmemory:Killprocess3577(java)score47orsacrificechildkernel:Outofmemory:Killprocess36
18、31(java)score47orsacrificechildkernel:Outofmemory:Killprocesskonnolitmomnnvifi11CWaCC3634(java)score47orsacrificechild,iav=cmr*o7CrcarriF,irorh1d原因:内存跑满,引起OoM解决方式:释放内存后,再启动容器五、版本不兼容报错31overlayft:Can,tdeletefilemovedfrombaselayertonewlycreateddirevenonext4原因:Centos提供的文件系统XFS和OVerlay兼容问题导致解决方式:这个问题的修复
19、在内核4.4.6以上32、docker:Errorresponsefromdaemon:OCIruntimecreatefailed:container_linux.go:344:startingcontainerprocesscausedprocess_linux.go:297:gettingthefinalchildspidfrompipecausedreadinit-p:connectionresetbypeer:unknown.原因:DOCker版本和操作系统版本不匹配解决方式:重新安装和操作系统内核支持的docker版本六、网络或端口问题报错33、WARNING:IPv4forwar
20、dingisdisabled.Networkingwillnotwork.原因:ipv4网络无法转发解决方式:usrlibSySCtLd/00-SyStem.conf在最后一行添加net.ipv4.ip_forward=1重启network服务。删除错误的容器,再次创建新容器34Creatingnetworkxxxxxxxwiththedefaultdriver原因:docker网关冲突启动容器、docker-compose启动容器后,断网问题解决方式:配置docker-compose.yml内给启动的容器配置参数network_mode:bridge35、Unabletofindanodet
21、hatsatisfiesthefollowingconditionsportxxxx原因:当容器使用端口映射(dockerrun-pxxxx:XXXX或COmPOSe模板中的POrtS)之后系统会在宿主机上创建一个Por3通过NAT来访问容器的指定POrt。如果宿主机上的端口被容器或者系统进程占用,就会导致端口分配失败。解决方式:清除占用端口的容器或者进程,或调整容器端口映射的宿主机端口避免冲突36、Errorresponsefromdaemon:serviceendpointwithnamexxxalready原因:端口已经被占用解决方式:重启docker容器37、docker:Errorr
22、esponsefromdaemon:driverfailedprogrammingexternalconnectivityonendpointXXXXX:Bindfor0.0.0.0:80failed:portisalreadyallocated原因:容器端口冲突解决方式:更换宿主机绑定端口七、DOCker安装报错38、安装docker报Requires:container-selinux=2.9Requires:container-selinux=2.9Youcouldtryusing-skip-brokentoworkaroundtheproblemYoucouldtryrunning:r
23、pm-Va-nofiles-nodigest原因:Container-SelinUX版本低或者是没安装的原因解决方式:wget-Oetcyum.repos.dCentOS-Base.repoyuminstallepel-releaseyummakecacheyuminstallcontainer-selinux39、安装docker-compose时报错uImportError:module*objecthasnoattributecheck-specifier,v原因:setuptools版本问题解决方式:升级setuptools到30.1.0版本以上版本pipinstall-upgrade
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Docker 容器 常见故障 排查 处理

链接地址:https://www.31ppt.com/p-6982752.html