linux内核 异常 log,Linux Kernel WARN()/BUG(), Oops/Panic, Tainted分析-程序员宅基地

技术标签: linux内核 异常 log  

稳定性范畴, 参考5.x kernel。

kernel Oops

Oops指的就是内核的不正确行为,比如对驱动来说:static int i82092aa_pci_probe(struct pci_dev *dev,

const struct pci_device_id *id)

{

unsigned char configbyte;

int i, ret;

ret = pci_enable_device(dev);

if (ret)

return ret;

/* PCI Configuration Control */

pci_read_config_byte(dev, 0x40, &configbyte);

switch (configbyte&6) {

case 0:

socket_count = 2;

break;

case 2:

socket_count = 1;

break;

case 4:

case 6:

socket_count = 4;

break;

default:

dev_err(&dev->dev,

"Oops, you did something we didn't think of.\n");

ret = -EIO;

goto err_out_disable;

}

这里的PCI配置读出来有异常,我们就认为他是一个Oops,打印一个错误,探测失败。

分配内存失败也算一种Oops,只不过不需要打出错误信息。td = kmalloc (sizeof (struct FS_BPENTRY), GFP_ATOMIC);

fs_dprintk (FS_DEBUG_ALLOC, "Alloc transd: %p(%zd)\n", td, sizeof (struct FS_BPENTRY));

if (!td) {

/* Oops out of mem */

return -ENOMEM;

}

在体系架构方面的Oops,比如arm64的bug Oops:static int bug_handler(struct pt_regs *regs, unsigned int esr)

{

switch (report_bug(regs->pc, regs)) {

case BUG_TRAP_TYPE_BUG:

die("Oops - BUG", regs, 0);

break;

如果report_bug()返回的是BUG_TRAP_TYPE_BUG,那就报个Oops log。

再比如非法访问也会走die("Oops", ):static void die_kernel_fault(const char *msg, unsigned long addr,

unsigned int esr, struct pt_regs *regs)

{

bust_spinlocks(1);

pr_alert("Unable to handle kernel %s at virtual address %016lx\n", msg,

addr);

mem_abort_decode(esr);

show_pte(addr);

die("Oops", regs, esr); //tj

bust_spinlocks(0);

do_exit(SIGKILL);

}

看下die():void die(const char *str, struct pt_regs *regs, int err)

{

int ret;

unsigned long flags;

raw_spin_lock_irqsave(&die_lock, flags);

oops_enter();

console_verbose();

bust_spinlocks(1);

ret = __die(str, err, regs); //tj

if (regs && kexec_should_crash(current))

crash_kexec(regs);

bust_spinlocks(0);

add_taint(TAINT_DIE, LOCKDEP_NOW_UNRELIABLE);

oops_exit();

if (in_interrupt())

panic("Fatal exception in interrupt"); //tj

if (panic_on_oops)

panic("Fatal exception"); //tj

raw_spin_unlock_irqrestore(&die_lock, flags);

if (ret != NOTIFY_STOP)

do_exit(SIGSEGV);

}

再看下__die():static int __die(const char *str, int err, struct pt_regs *regs)

{

static int die_counter;

int ret;

pr_emerg("Internal error: %s: %x [#%d]" S_PREEMPT S_SMP "\n",

str, err, ++die_counter);

/* trap and error numbers are mostly meaningless on ARM */

ret = notify_die(DIE_OOPS, str, regs, err, 0, SIGSEGV);

if (ret == NOTIFY_STOP)

return ret;

print_modules();

show_regs(regs);

dump_kernel_instr(KERN_EMERG, regs);

return ret;

}

打印类似如下log:35.449887: <6> Internal error: Oops - BUG: 0 [#1] PREEMPT SMP

35.449893: <6> Modules linked in:

35.449901: <6> Process init (pid: 1, stack limit = 0x00000000826895f7)

后面会call panic(),不过是有条件的:if (in_interrupt())

panic("Fatal exception in interrupt");

if (panic_on_oops)

panic("Fatal exception");

如果这个Oops在中断里,会走panic()。如果不在但if (panic_on_oops)成立,也走panic()。

可见,Oops不一定会导致panic。bug_handle()对BUG_TRAP_TYPE_BUG还不默认panic?

btw: arm64的Oops是怎么触发的了?稍后看。

Kernel panic

kernel panic就是不可恢复的错误了,怎么处理?我想复位or我就想定这。/**

* panic - halt the system

* @fmt: The text string to print

*

* Display a message, then perform cleanups.

*

* This function never returns.

*/

void panic(const char *fmt, ...)

{

...

pr_emerg("Kernel panic - not syncing: %s\n", buf);

...

if (panic_timeout > 0) { //tj: 延迟重启

/*

* Delay timeout seconds before rebooting the machine.

* We can't use the "normal" timers since we just panicked.

*/

pr_emerg("Rebooting in %d seconds..\n", panic_timeout); //tj

for (i = 0; i < panic_timeout * 1000; i += PANIC_TIMER_STEP) {

touch_nmi_watchdog();

if (i >= i_next) {

i += panic_blink(state ^= 1);

i_next = i + 3600 / PANIC_BLINK_SPD;

}

mdelay(PANIC_TIMER

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_28678517/article/details/116600576

智能推荐

日志_log4j:自定义log4j日志文件存放路径_wildfly部署后log4j对应的log在哪里-程序员宅基地

文章浏览阅读1.7k次。话说这是第一次自己配置log4j,以前都是拿来就用,完全没想过这个问题。 log4j的配置文件还是比较好用的,只要编译后log4j.properties文件是在classes目录下,它就会自动查找这个文件。 把记录日志放到文件中也是比较好配置的,问题是这个日志文件在哪儿,死活没找到?这让我有些慌张,如果不自己定义路径,将它控制住,就会觉得有些不舒服。 在网上搜了大半天,关于log4j讲解的文章_wildfly部署后log4j对应的log在哪里

JRebel热部署 xml文件修改 sql文件修改 不生效_jrebel 不更新sql-程序员宅基地

文章浏览阅读3.2k次。JRebel热部署 xml文件修改 sql文件修改 不生效_jrebel 不更新sql

论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning_poseidon: privacypreserving federated neural netwo-程序员宅基地

文章浏览阅读1.6k次,点赞6次,收藏14次。论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network LearningNDSS 2021录用文章目录论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning一、机器学习1. 机器学习(ML)中的挑战2. 隐私保护机器学习(PPML)二、POSEIDON方案1. 系统和威胁模型2. 方案总览多方同态加密(MHE)联邦学习主要挑战和解决方法3. 方案CKKS_poseidon: privacypreserving federated neural network learning

opentsdb远程代码执行(CVE-2020-35476)-程序员宅基地

文章浏览阅读1.9k次。1漏洞背景OpenTSDB(Open Time Series Data Base)是基于HBASE构建的分布式、可扩展的时间序列数据库。OpenTSDB可以获取电力行业、化工行业、物联网行业等各类型实时监测、检查与分析设备所采集、产生的时间序列数据,并提供存储、索引以及图形化服务,使其易于访问和可视化。2 漏洞原理OpenTSDB 2.4.0及之前版本中存在远程代码执行漏洞,用户提交的yrange参数或其他相关参数的值在/src/tsd/GraphHandler.java文件中进行简单的反引号._cve-2020-35476

警惕rapidxml的陷阱(二):在Android上默认内存池分配数组过大,容易导致栈溢出_an element node. name contains element name. value-程序员宅基地

文章浏览阅读995次。项目中我们的模块很快写好了,在windows和linux上测试都工作的很好,但在Android上有时候却会崩溃。背景:我们的模块是c++写的,编译成so动态库在不同的平台(linux,windows,Android)上运行;Android上我们包装了一个service,通过jni加载so动态库运行的。 解决程序崩溃问题,首先要找到崩溃点。但我们的程序是service+jni的形式,直接_an element node. name contains element name. value contains text of first da

6.4.3 Xacro_完整使用流程示例_ros6.4-程序员宅基地

文章浏览阅读628次,点赞3次,收藏4次。ROS入门 6.4.3 Xacro_完整使用流程示例《ROS入门-理论与实践》视频教程镇楼》需求描述:使用 Xacro 优化 URDF 版的小车底盘模型实现结果演示:1.编写 Xacro 文件<!-- 使用 xacro 优化 URDF 版的小车底盘实现: 实现思路: 1.将一些常量、变量封装为 xacro:property 比如:PI 值、小车底盘半径、离地间距、车轮半径、宽度 .... 2.使用 宏 封装驱动轮以及支撑轮实现,调用相关_ros6.4

随便推点

oozie4.3.1编译_oozie 4.3.1 编译-程序员宅基地

文章浏览阅读707次。oozie编译一、版本oozie版本:4.3.1JDK:1.8HADOOP:2.7.7hive:hivepig:0.16.0sqoop:1.4.7spark:2.3.0hbase:0.94.27tomcat:8.0.53二、编译前需要修改的地方root pom.xmljdk版本修改 &amp;amp;amp;amp;lt;properties&amp;amp;amp;amp;gt; &amp;amp;amp;amp;lt;targe_oozie 4.3.1 编译

2022-我的秋招之旅_合川电信面试-程序员宅基地

文章浏览阅读966次,点赞2次,收藏2次。123_合川电信面试

K-means原理、优化及应用-程序员宅基地

文章浏览阅读9.6w次,点赞57次,收藏392次。 K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。1. K-Means原理初探    K-Me..._k-means

QCC305x-QCC304x系列开发教程(系统篇)之3.2-音频子系统详解_qcc 音频子系统开发-程序员宅基地

文章浏览阅读2.3k次。音频子系统功能:CPU时钟选项(灵活的时钟选项从2 MHz到120 MHz音频处理) 程序ROM: 6Mb 程序RAM/缓存:112KB 数据RAM大小:448KB 模拟DAC:单模模拟输出可配置为差分ab类音频输出或差分高效率输出 模拟ADC:立体声模拟输入可配置为单端线输入,或不平衡或平衡模拟麦克风输入 I2s/脉冲编码调制(PCM)接口1 x单向24位i2s接口 支持8kHz,16kHz,32kHz,44.1 kHz,48kHz,96kHz,192kHz,384kHz采样速..._qcc 音频子系统开发

ArcGIS API for JavaScript——地图展示分享-程序员宅基地

文章浏览阅读363次,点赞8次,收藏9次。https://zhuanlan.zhihu.com/p/93662287

音频特征提取——pyAudioAnalysis工具包-程序员宅基地

文章浏览阅读4.4k次。转载:http://www.cnblogs.com/xingshansi/p/6806637.html前言语音识别等应用离不开音频特征的提取,最近在看音频特征提取的内容,用到一个python下的工具包——pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis,该工具包的说明文档可以点击这里下载,对应的gith..._pyaudioanalysis