用TensorFlow搞定常微分方程：手把手教你用神经网络求解ODE（附完整代码）

张开发

• 2026/4/17 23:02:03 • 15 分钟阅读

分享文章

用TensorFlow搞定常微分方程手把手教你用神经网络求解ODE附完整代码微分方程在工程和科学领域无处不在从物理建模到金融预测都离不开它。传统数值解法如欧拉法或龙格-库塔法虽然成熟但面对高维或复杂边界条件时往往力不从心。最近几年用神经网络求解微分方程的新思路开始崭露头角——不需要预先设计离散格式也不用担心网格生成一个普适的神经网络就能搞定各类方程。今天我们就用TensorFlow 2.x从零开始实现这个酷炫的技术。1. 为什么选择神经网络解ODE传统数值方法解微分方程时需要在定义域内密集采样离散点逐个计算函数值。而神经网络的妙处在于它通过学习连续函数表示可以一次性覆盖整个求解域。具体来说有三大优势连续解表示神经网络直接输出连续函数不像传统方法只给出离散点天然并行性GPU可以高效计算全定义域的解不受网格限制逆问题友好同样的框架稍加修改就能处理参数反演问题看个简单例子假设我们要解的一阶ODE是du/dt 2t, u(0)1解析解显然是u(t)t²1。下面我们就用神经网络来逼近这个解。2. 环境准备与模型设计2.1 安装依赖确保你的Python环境有这些包pip install tensorflow2.8.0 matplotlib numpy2.2 网络架构设计我们采用一个包含两个隐藏层的MLP多层感知机每层32个神经元import tensorflow as tf # 网络参数 n_input 1 # 输入维度(t) n_hidden 32 # 隐藏层神经元数 n_output 1 # 输出维度(u) model tf.keras.Sequential([ tf.keras.layers.Dense(n_hidden, activationsigmoid, input_shape(n_input,)), tf.keras.layers.Dense(n_hidden, activationsigmoid), tf.keras.layers.Dense(n_output) ])提示sigmoid激活函数在这里表现不错对于更复杂的方程可以尝试tanh或swish3. 损失函数的精妙设计神经微分方程的核心创新点在于损失函数的设计。我们需要让网络同时满足微分方程本身的条件初始/边界条件对应的损失函数由两部分组成def loss_fn(t): with tf.GradientTape() as tape: tape.watch(t) u model(t) du_dt tape.gradient(u, t) # 自动微分求导 # 微分方程损失 (du/dt - 2t)^2 ode_loss tf.reduce_mean(tf.square(du_dt - 2*t)) # 初始条件损失 (u(0)-1)^2 ic_loss tf.square(model(tf.constant([[0.0]])) - 1) return ode_loss ic_loss4. 训练技巧与可视化4.1 智能采样策略不同于传统方法均匀采样我们可以动态调整采样点def generate_samples(n100): # 初始阶段集中在t0附近 if epoch 1000: t_samples tf.random.uniform((n//2,1), 0, 0.2) t_samples tf.concat([t_samples, tf.random.uniform((n//2,1), 0, 1)],0) else: t_samples tf.random.uniform((n,1), 0, 1) return t_samples4.2 训练循环optimizer tf.keras.optimizers.Adam(learning_rate0.001) for epoch in range(5000): t generate_samples() with tf.GradientTape() as tape: loss loss_fn(t) grads tape.gradient(loss, model.trainable_variables) optimizer.apply_gradients(zip(grads, model.trainable_variables)) if epoch % 500 0: print(fEpoch {epoch}, Loss: {loss.numpy():.4f})4.3 结果可视化训练完成后对比解析解和神经网络预测import matplotlib.pyplot as plt t_test np.linspace(0, 1, 100).reshape(-1,1) u_pred model.predict(t_test) u_true t_test**2 1 plt.figure(figsize(10,6)) plt.plot(t_test, u_true, labelAnalytical Solution) plt.plot(t_test, u_pred, --, labelNN Prediction) plt.legend() plt.xlabel(t) plt.ylabel(u(t)) plt.show()5. 进阶技巧与问题排查5.1 高阶ODE处理对于二阶ODE如d²u/dt² k du/dt f(t)需要修改损失函数def second_order_loss(t): with tf.GradientTape(persistentTrue) as tape: tape.watch(t) u model(t) du_dt tape.gradient(u, t) d2u_dt2 tape.gradient(du_dt, t) ode_loss tf.reduce_mean(tf.square(d2u_dt2 k*du_dt - f(t))) ic_loss tf.square(model(0)-u0) tf.square(du_dt[0]-v0) return ode_loss ic_loss5.2 常见问题解决方案问题现象可能原因解决方案损失震荡不收敛学习率太大降低学习率或使用自适应优化器预测结果偏置初始条件权重不足增加初始条件损失项的权重局部拟合不佳采样点不足在关键区域增加采样密度5.3 性能优化技巧批处理计算同时计算多个点的微分tf.function def batch_loss(t_batch): # t_batch shape: (batch_size, 1) with tf.GradientTape(persistentTrue) as tape: tape.watch(t_batch) u_batch model(t_batch) du_dt tape.gradient(u_batch, t_batch) # 计算各点损失... return tf.reduce_mean(losses)混合精度训练加速计算policy tf.keras.mixed_precision.Policy(mixed_float16) tf.keras.mixed_precision.set_global_policy(policy)6. 实战非线性ODE求解让我们挑战一个非线性ODEdu/dt -u^2 cos(t), u(0)0关键修改在于损失函数def nonlinear_loss(t): with tf.GradientTape() as tape: tape.watch(t) u model(t) du_dt tape.gradient(u, t) # 非线性项处理 ode_loss tf.reduce_mean(tf.square(du_dt u**2 - tf.cos(t))) ic_loss tf.square(model(tf.constant([[0.0]]))) return ode_loss ic_loss训练这个系统时我发现初始阶段损失下降较慢这时可以采用课程学习策略——先训练简单的线性部分再逐步引入非线性项。另一个实用技巧是在损失函数中加入正则项防止过拟合def total_loss(t): ode_loss nonlinear_loss(t) # L2正则化 l2_loss tf.add_n([tf.nn.l2_loss(w) for w in model.trainable_variables]) return ode_loss 1e-4 * l2_loss

更多文章

前端开发 2026/4/17 23:55:03

终极Moco性能优化与部署指南：生产环境中的最佳配置方案

终极Moco性能优化与部署指南：生产环境中的最佳配置方案【免费下载链接】moco Easy Setup Stub Server 项目地址: https://gitcode.com/gh_mirrors/moc/moco Moco作为一款Easy Setup Stub Server，能够帮助开发者快速搭建模拟服务器环境&#xff0…

终极Authlogic测试指南：如何为Ruby认证系统编写可靠测试用例【免费下载链接】authlogic A simple ruby authentication solution. 项目地址: https://gitcode.com/gh_mirrors/au/authlogic Authlogic是一个简单而强大的Ruby认证解决方案，为Ruby …

张开发

前端开发 2026/4/13 15:38:15

PGSql-PostGresql数据库操作

一、常用sql语句函数 1.1 日期字符串使用 // 时间戳和字符串比较 to_char( )<if test"null ! repm.startReleaseTime and ! repm.startReleaseTime.trim() and null ! repm.endReleaseTime and ! repm.endReleaseTime.trim()">AND to_char( a.register_tim…

张开发

用TensorFlow搞定常微分方程：手把手教你用神经网络求解ODE（附完整代码）

最新文章

AI 数据安全怎么管？迅易的 8 条使用规范

3分钟极速瘦身：Win11Debloat让你的Windows系统飞起来

AnyLabeling vs X-AnyLabeling：哪个自动标注工具更适合你的AI项目？（含实测对比）

从零构建：在HTML/JS项目中集成WebAssembly模块

告别命令行！用Apache Zeppelin Notebook零代码搞定Spark数据分析（附Hive/MySQL集成配置）

【实战解析】ZYNQ7020 DNA_PORT：从原理到代码的硬件身份认证实现

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

终极Moco性能优化与部署指南：生产环境中的最佳配置方案

别再用笨方法点灯了！手把手教你用C51+Keil写一个可复用的LED驱动模块

EffRes-DrowsyNet：融合EfficientNetB0与ResNet50优势的实时驾驶员疲劳检测系统设计与性能验证

避开这些坑！用Python/CANoe模拟UDS 0x19服务诊断ECU的完整流程与常见错误排查

3D点云检测实战-Nuscenes数据集解析与可视化工具全攻略

音乐流派分类与情感分析结合：基于ccmusic-database/music_genre的扩展应用

终极个人主页性能优化实战：懒加载、代码分割与缓存策略全解析

RAID性能调优实战：用Arcconf工具最大化ThinkSystem 9350的IOPS（附压力测试对比）

ServicePointManager.SecurityProtocol设置无效？可能是Windows系统TLS设置搞的鬼（排查指南）

KaTrain围棋AI：三步解锁专业级智能训练，从新手到高手的高效进阶指南

终极Authlogic测试指南：如何为Ruby认证系统编写可靠测试用例

PGSql-PostGresql数据库操作