Paper Detail

dynActivation: A Trainable Activation Family for Adaptive NonlinearitydynActivation：自适应非线性可训练激活函数族

cs.CV大语言模型CVTransformer热门获取

dynActivation Authors

2026年03月24日

arXiv: 2603.22154v1

作者人数

1

标签数量

4

内容状态

含 PDF

原文 + 中文

同页查看标题和摘要的双语信息

PDF 预览

直接在详情页阅读或下载论文全文

深度分析

继续下钻到 AI 生成的结构化解读

摘要 / Abstract

This paper introduces dynActivation, a per-layer trainable activation function that dynamically interpolates between base nonlinearities and linear paths using lightweight learned scalars. The proposed method is evaluated across vision tasks (CIFAR-10, MNIST) and language modeling tasks, demonstrating significant improvements in training efficiency (up to 54% faster) and performance. On CIFAR-10, dynActivation(Mish) achieves up to 14.02% improvement over static Mish, with 24% reduction in convergence time. In deep network scaling experiments (up to 75 layers), dynActivation maintains robust performance (95.3-99.3% accuracy) while ReLU collapses below 80%, demonstrating that adaptive nonlinearity linearization in deep layers enhances both training stability and final model quality.

摘要 / Abstract

分类 / Categories

深度分析