Это хорошая статья. Для получения дополнительной информации нажмите здесь.

Производная

Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

График функции , нарисованный в черном и касательной к этой функции, обращается в красный цвет. Наклона касательной равен производной функции в отмеченной точке.

В математике , то производная из функции действительного переменного меры чувствительности к изменению (выходное значение) значение функции по отношению к изменению его аргумента (входное значение). Производные - это фундаментальный инструмент исчисления . Например, производной от положения движущегося объекта по времени является его скорость : она измеряет, насколько быстро положение объекта изменяется с течением времени.

Производная функции одной переменной при выбранном значении входного сигнала, когда оно существует, то есть наклон от касательной к графику функции в этой точке. Касательная линия является наилучшим линейным приближением функции вблизи этого входного значения. По этой причине производная часто описывается как «мгновенная скорость изменения», то есть отношение мгновенного изменения зависимой переменной к изменению независимой переменной.

Производные могут быть обобщены на функции нескольких действительных переменных . В этом обобщении производная интерпретируется как линейное преобразование , график которого (после соответствующего перевода) является наилучшим линейным приближением графика исходной функции. Матрица Якоби является матрицей , которая представляет это линейное преобразование с относительно базиса данного по выбору независимых и зависимых переменных. Его можно вычислить с помощью частных производных по независимым переменным. Для действительной функции нескольких переменных матрица Якоби сводится к вектору градиента .

Процесс нахождения производной называется дифференцированием . Обратный процесс называется антидифференцировкой . Фундаментальная теорема исчисления относится antidifferentiation с интеграцией . Дифференцирование и интегрирование составляют две фундаментальные операции в исчислении одной переменной. [Примечание 1]

Дифференциация [ править ]

Дифференциация - это действие по вычислению производной. Производная функции y = f ( x ) от переменной x является мерой скорости, с которой значение y функции изменяется по отношению к изменению переменной x . Это называется производной от F по отношению к й . Если х и у являются действительными числами , а если граф из F представлен в зависимости от х , производная является наклон этого графика в каждой точке.

Наклон линейной функции:

Простейший случай, кроме тривиального случая постоянной функции , когда у является линейной функцией от х , а это означает , что график у представляет собой линию. В этом случае y = f ( x ) = mx + b для действительных чисел m и b , а наклон m определяется выражением

где символ Δ ( Дельта ) является сокращением для «изменения в», а комбинации и относятся к соответствующим изменениям, т. е.

.

Приведенная выше формула верна, потому что

Таким образом

Это дает значение для наклона линии.

Если функция f не является линейной (т.е. ее график не является прямой линией), то изменение y, деленное на изменение x, варьируется в рассматриваемом диапазоне: дифференцирование - это метод поиска уникального значения для этой скорости изменения, не в определенном диапазоне, а при любом заданном значении x .

Скорость изменения как предельное значение
Рисунок 1 . Касательной линии в точке ( х , е ( х ))
Рисунок 2. секущая к кривой у = F ( х ) определяется точками ( х , F ( х )) и ( х + ч , е ( х + ч ))
Рис. 3. Касательная как предел секущих
Рис. 4. Анимированная иллюстрация: касательная (производная) как предел секущих

Идея, показано на рисунках 1 до 3, чтобы вычислить скорость изменения в качестве предельного значения по отношению разностей Д у / Δ х , как Δ х стремится к 0.

Обозначение [ править ]

Для производной обычно используются два различных обозначения: одно происходит от Готфрида Вильгельма Лейбница, а другое от Жозефа Луи Лагранжа . Третье обозначение, впервые использованное Исааком Ньютоном , иногда встречается в физике.

В обозначениях Лейбница , бесконечно малое изменение х обозначим через дх , а производная у по х записывается

предлагая соотношение двух бесконечно малых величин. (Вышеупомянутое выражение читается как «производная y по отношению к x », « dy на dx » или « dy по dx ». Устная форма « dy dx » часто используется в разговорной речи, хотя это может привести к путанице. )

В обозначениях Лагранжа производная по x функции f ( x ) обозначается f ' ( x ) (читается как « f, простое число x ») или f x ′ ( x ) (читается как « f простое число x из x»). "), в случае неоднозначности переменной, подразумеваемой дифференцированием. Обозначения Лагранжа иногда неправильно приписывают Ньютону .

В обозначении Ньютона для дифференцирования (также называемом точечным обозначением для дифференцирования) над зависимой переменной ставится точка. То есть, если y является функцией t , то производная y по t равна

Высшие производные представлены с помощью нескольких точек, как в

Обозначение Ньютона обычно используется, когда независимая переменная обозначает время . Если положение y является функцией t , то обозначает скорость [1] и обозначает ускорение . [2]

Строгое определение [ править ]

Секущая приближается к касательной, когда .

Самый распространенный подход к превращению этой интуитивной идеи в точное определение - это определение производной как предела разностных частных действительных чисел. [3] Это подход, описанный ниже.

Пусть f - вещественная функция, определенная в открытой окрестности действительного числа a . В классической геометрии касательная линия к графику функции f в точке a была единственной линией, проходящей через точку ( a , f ( a )), которая не пересекалась с графиком f трансверсально , что означает, что линия не проходила прямо через точку ( a , f ( a )). график. Производная y по x в точке a геометрически представляет собой наклон касательной линии к графику f в точке( а , е ( а )) . Наклон касательной очень близок к наклону прямой, проходящей через ( a , f ( a )) и ближайшую точку на графике, например ( a + h , f ( a + h )) . Эти линии называются секущими линиями . Значение h, близкое к нулю, дает хорошее приближение к наклону касательной, а меньшие значения (по модулю ) h , как правило, дают лучшее приближение.. Наклон m секущей линии - это разница между значениями y этих точек, деленная на разницу между значениями x , то есть

Это выражение Ньютона «S разница фактор . Переход от приближенного к точному ответу осуществляется с использованием предела . Геометрически предел секущих - касательная. Следовательно, предел отношения разности при приближении h к нулю, если он существует, должен представлять наклон касательной к ( a , f ( a )) . Этот предел определяется как производная функции f в точке a :

Когда предел существует, f называется дифференцируемой в a . Здесь f ( a ) - одно из нескольких общепринятых обозначений производной ( см. Ниже ). Из этого определения видно , что дифференцируемая функция F является увеличение тогда и только тогда , когда ее производная положительна и убывает тогда и только тогда ее производная отрицательна. Этот факт широко используется при анализе поведения функций, например, при поиске локальных экстремумов .

Эквивалентно производная удовлетворяет свойству, что

которая интуитивно интерпретируется (см. рисунок 1), что касательная к f в точке a дает наилучшее линейное приближение

к f около a (т. е. для малых h ). Эту интерпретацию легче всего обобщить на другие параметры ( см. Ниже ).

Подстановка 0 вместо h в коэффициент разности приводит к делению на ноль , поэтому наклон касательной линии нельзя найти напрямую с помощью этого метода. Вместо этого определите Q ( h ) как коэффициент разности как функцию h :

Q ( h ) - это наклон секущей линии между ( a , f ( a )) и ( a + h , f ( a + h )) . Если f - непрерывная функция , то есть ее график представляет собой непрерывную кривую без промежутков, то Q - непрерывная функция вдали от h = 0 . Если существует предел lim h → 0 Q ( h ) , что означает, что есть способ выбрать значение дляQ (0), который делает Q непрерывной функцией, то функция f дифференцируема в точке a , а ее производная в точке a равна Q (0) .

На практике существование непрерывного расширения разностного отношения Q ( h ) до h = 0 показано изменением числителя, чтобы сократить h в знаменателе. Такие манипуляции могут сделать предельное значение Q для малых h ясным, даже если Q все еще не определено при h = 0 . Этот процесс может быть долгим и утомительным для сложных функций, и для упрощения обычно используются многие ярлыки.

Определение гиперреалов [ править ]

Относительно гиперреального расширения вещественных чисел RR производная вещественной функции y = f ( x ) в вещественной точке x может быть определена как тень частногоy/xдля бесконечно малых x , где y = f ( x + ∆ x ) - f ( x ) . Здесь естественное продолжение f на гиперреалы по-прежнему обозначается f . Здесь говорят, что производная существует, если тень не зависит от выбранной бесконечно малой величины.

Пример [ править ]

Квадратная функция

Квадратная функция, заданная формулой f ( x ) = x 2 , дифференцируема при x = 3 , а ее производная равна 6. Этот результат устанавливается путем вычисления предела, когда h приближается к нулю разностного частного f (3) :

Последнее выражение показывает, что коэффициент разности равен 6 + h, когда h 0, и не определен, когда h = 0 , из-за определения коэффициента разности. Однако определение предела говорит, что коэффициент разности не нужно определять, когда h = 0 . Ограничение является результатом того , чтобы позволить ч к нулю, а это означает , что это значение , которое 6 + ч , как правило, в час становится очень мало:

Следовательно, наклон графика функции квадрата в точке (3, 9) равен 6 , и поэтому его производная в точке x = 3 равна f (3) = 6 .

В более общем плане аналогичное вычисление показывает, что производная функции квадрата при x = a равна f ( a ) = 2 a :

Непрерывность и дифференцируемость [ править ]

Эта функция не имеет производной в отмеченной точке, так как функция там не непрерывна (в частности, имеет скачкообразный разрыв ).

Если е является дифференцируемой в , то е также должен быть непрерывным на . В качестве примера выберите точку a и пусть f будет пошаговой функцией, которая возвращает значение 1 для всех x, меньших a , и возвращает другое значение 10 для всех x, больших или равных a . f не может иметь производную в a . Если h отрицательно, то a + h находится в нижней части шага, поэтому секущая линия отот a до a + h очень крутой, и когда h стремится к нулю, наклон стремится к бесконечности. Если h положительно, то a + h находится в верхней части ступеньки, поэтому секущая линия от a до a + h имеет нулевой наклон. Следовательно, секущие линии не приближаются ни к одному наклону, так что предела коэффициента разности не существует.

Функция абсолютного значения является непрерывной, но не может быть дифференцируемой при x = 0, поскольку наклоны касательной не приближаются к одному и тому же значению слева, как справа.

Однако даже если функция непрерывна в какой-то точке, она не может быть дифференцируемой там. Например, функция абсолютного значения, заданная как f ( x ) = | х | непрерывна в точке x = 0 , но не дифференцируема там. Если h положительно, то наклон секущей от 0 до h равен единице, тогда как если h отрицателен, то наклон секущей от 0 до h отрицателен. Это можно увидеть графически как «перегиб» или «куспид» на графике при x = 0 . Даже функция с гладким графиком не дифференцируема в точке, где еекасательная вертикальна : например, функция f ( x ) = x 1/3 не дифференцируема при x = 0 .

Таким образом, функция, у которой есть производная, является непрерывной, но есть непрерывные функции, у которых нет производной.

Большинство функций, которые встречаются на практике, имеют производные во всех точках или почти в каждой точке. В начале истории математического анализа многие математики предполагали, что непрерывная функция дифференцируема в большинстве точек. В мягких условиях, например, если функция является монотонной или липшицевой , это верно. Однако в 1872 году Вейерштрасс нашел первый пример функции, непрерывной всюду, но нигде не дифференцируемой. Этот пример теперь известен как функция Вейерштрасса . В 1931 году Стефан Банах доказал, что набор функций, имеющих производную в некоторой точке, является скудным множеством.в пространстве всех непрерывных функций. [4] Неформально это означает, что практически любые случайные непрерывные функции не имеют производной хотя бы в одной точке.

Производная как функция [ править ]

Производная дифференцируемой функции в разных точках. В этом случае производная равна:

Пусть f - функция, имеющая производную в каждой точке области определения . Затем мы можем определить функцию, которая отображает каждую точку x в значение производной f в точке x . Эта функция записывается как f ' и называется производной функцией или производной от f .

Иногда f имеет производную в большинстве, но не во всех точках области определения. Функция, значение которой в a равно f ( a ) всякий раз, когда f ( a ) определено, а где-либо еще не определено, также называется производной f . Это все еще функция, но ее область определения строго меньше области определения f .

Используя эту идею, дифференцирование становится функцией функций: производная - это оператор , область определения которого представляет собой набор всех функций, имеющих производные в каждой точке своей области определения, а диапазон значений - это набор функций. Если обозначить этот оператор через D , то D ( f ) будет функцией f . Поскольку D ( f ) является функцией, ее можно вычислить в точке a . По определению производной функции D ( f ) ( a ) = f ( a ) .

Для сравнения рассмотрим функцию удвоения, задаваемую формулой f ( x ) = 2 x ; f является функцией действительного числа действительного числа, что означает, что он принимает числа в качестве входных данных и имеет числа в качестве выходных данных:

Однако оператор D не определен для отдельных чисел. Он определен только для функций:

Поскольку выход D является функцией, выход D может быть оценен в точке. Например, когда D применяется к функции квадрата, xx 2 , D выводит функцию удвоения x ↦ 2 x , которую мы назвали f ( x ) . Затем эта функция вывода может быть вычислена, чтобы получить f (1) = 2 , f (2) = 4 и т. Д.

Высшие производные [ править ]

Пусть f - дифференцируемая функция, а f - ее производная. Производная от f (если она есть) записывается f ′ ′ и называется второй производной от f . Точно так же производная второй производной, если она существует, записывается как f ′ ′ ′ и называется третьей производной от f . Продолжая этот процесс, можно определить, если она существует, n- ю производную как производную от ( n - 1) -й производной. Эти повторяющиеся производные называются производными более высокого порядка.. П - й производной также называется производная порядка п .

Если x ( t ) представляет положение объекта в момент времени t , то производные x более высокого порядка имеют особую интерпретацию в физике . Первая производная от x - это скорость объекта . Вторая производная от x - это ускорение . Третья производная от x - рывок . И, наконец, производные x с четвертой по шестую - это щелчок, треск и треск ; наиболее применимо к астрофизике .

Функция f не обязательно должна иметь производную (например, если она не непрерывна). Точно так же, даже если у f есть производная, у нее может не быть второй производной. Например, пусть

Расчет показывает, что f - дифференцируемая функция, производная которой в точке определяется выражением

f ' ( x ) - это удвоенная функция абсолютного значения в точке, и она не имеет производной в нуле. Подобные примеры показывают, что функция может иметь k- ю производную для каждого неотрицательного целого числа k, но не ( k + 1) -ю производную. Функция, которая имеет k последовательных производных, называется k раз дифференцируемой . Если при этом k- я производная непрерывна, то говорят, что функция имеет класс дифференцируемости C k . (Это более сильное условие, чем наличие k производных, как показано во втором примере Гладкость § Примеры .) Функция, имеющая бесконечно много производных, называется бесконечно дифференцируемой или гладкой .

На вещественной прямой каждая полиномиальная функция бесконечно дифференцируема. По стандартным правилам дифференцирования , если многочлен степени n дифференцировать n раз, он становится постоянной функцией . Все его последующие производные тождественно равны нулю. В частности, они существуют, поэтому многочлены являются гладкими функциями.

Производные функции f в точке x обеспечивают полиномиальные приближения к этой функции вблизи x . Например, если f дважды дифференцируема, то

в том смысле, что

Если f бесконечно дифференцируема, то это начало ряда Тейлора для f, вычисляемого в x + h вокруг x .

Точка перегиба [ править ]

Точка, в которой вторая производная функции меняет знак, называется точкой перегиба . [5] В точке перегиба вторая производная может быть равна нулю, как в случае точки перегиба x = 0 функции, заданной посредством , или она может не существовать, как в случае точки перегиба x = 0 функции, заданной . В точке перегиба функция переключается с выпуклой функции на вогнутую или наоборот.

Обозначение (подробности) [ править ]

Обозначения Лейбница [ править ]

Символы , и были введены Готфридом Вильгельмом Лейбницем в 1675 году. [6] Они все еще широко используются, когда уравнение y = f ( x ) рассматривается как функциональная связь между зависимыми и независимыми переменными . Тогда первая производная обозначается через

и когда-то считался бесконечно малым частным. Высшие производные выражаются с помощью обозначений

для n- й производной от . Это сокращения для нескольких применений оператора производной. Например,

Используя обозначения Лейбница, мы можем записать производную от в точке двумя разными способами:

Обозначения Лейбница позволяют указать переменную для дифференцирования (в знаменателе), которая актуальна при частичном дифференцировании . Его также можно использовать для записи правила цепочки как [Примечание 2]

Обозначения Лагранжа [ править ]

Иногда его называют простым обозначением , [7] одно из наиболее распространенных современных обозначений для дифференцирования принадлежит Жозефу-Луи Лагранжу и использует штрих , так что обозначается производная функции . Аналогично обозначаются вторая и третья производные

  и  

Чтобы обозначить количество производных за пределами этой точки, некоторые авторы используют римские цифры в верхнем индексе , тогда как другие помещают число в круглые скобки:

  или же  

Последнее обозначение обобщает, чтобы получить обозначение для n- й производной от - это обозначение наиболее полезно, когда мы хотим говорить о производной как о самой функции, так как в этом случае обозначение Лейбница может стать громоздким.

Обозначения Ньютона [ править ]

Обозначение Ньютона для дифференцирования, также называемое точечным обозначением, помещает точку над именем функции, чтобы представить производную по времени. Если , то

  и  

обозначают соответственно первую и вторую производные от . Это обозначение используется исключительно для производных по времени или длине дуги . Обычно он используется в дифференциальных уравнениях в физике и дифференциальной геометрии . [8] [9] Точечная запись, однако, становится неуправляемой для производных высокого порядка (порядка 4 или более) и не может иметь дело с несколькими независимыми переменными.

Обозначения Эйлера [ править ]

В нотации Эйлера используется дифференциальный оператор , который применяется к функции для получения первой производной . П - й производной обозначается .

Если y = f ( x ) является зависимой переменной, то часто индекс x добавляется к D, чтобы прояснить независимую переменную x . Тогда записываются обозначения Эйлера

  или   ,

хотя этот нижний индекс часто опускается, когда переменная x понимается, например, когда это единственная независимая переменная, присутствующая в выражении.

Обозначения Эйлера полезны для формулировки и решения линейных дифференциальных уравнений .

Правила вычисления [ править ]

Производная функции, в принципе, может быть вычислена из определения, рассматривая коэффициент разности и вычисляя его предел. На практике, когда известны производные нескольких простых функций, производные других функций легче вычислять, используя правила получения производных более сложных функций от более простых.

Правила для основных функций [ править ]

Вот правила для производных наиболее распространенных основных функций, где а - действительное число.

  • Производные от полномочий :
  • Экспоненциальные и логарифмические функции :
  • Тригонометрические функции :
  • Обратные тригонометрические функции :

Правила для комбинированных функций [ править ]

Вот некоторые из самых основных правил вывода производной сложной функции из производных основных функций.

  • Постоянное правило : если f ( x ) постоянна, то
  • Правило суммы :
    для всех функций f и g и всех действительных чисел и .
  • Правило продукта :
    для всех функций f и g . Как частный случай, это правило включает в себя тот факт , когда является постоянным, так как по правилу постоянная.
  • Правило частного :
    для всех функций f и g на всех входах, где g ≠ 0 .
  • Цепное правило для составных функций: если, то

Пример расчета [ править ]

Производная функции, заданной формулой

является

Здесь второй член был вычислен с использованием правила цепочки, а третий - с использованием правила продукта . Также использовались известные производные элементарных функций x 2 , x 4 , sin ( x ), ln ( x ) и exp ( x ) = e x , а также константа 7.

В высших измерениях [ править ]

Векторнозначные функции [ править ]

Вектор-функция у реальной переменной посылает действительные числа к векторов в некотором векторном пространстве R п . Векторнозначная функция может быть разбита на ее координатные функции y 1 ( t ), y 2 ( t ), ..., y n ( t ) , что означает, что y ( t ) = ( y 1 ( t ),. .., y n ( t )) . Сюда входят, например, параметрические кривые в R 2или R 3 . Координатные функции являются вещественными функциями, поэтому к ним применимо приведенное выше определение производной. Производная y ( t ) определяется как вектор , называемый касательным вектором , координаты которого являются производными координатных функций. То есть,

Эквивалентно,

если предел существует. Вычитание в числителе - это вычитание векторов, а не скаляров. Если производная y существует для каждого значения t , тогда y ′ - другая вектор-функция.

Если e 1 , ..., e n является стандартным базисом для R n , то y ( t ) также можно записать как y 1 ( t ) e 1 + ⋯ + y n ( t ) e n . Если мы предположим, что производная векторной функции сохраняет свойство линейности , то производная y ( t ) должна быть

потому что каждый из базисных векторов является константой.

Это обобщение полезно, например, если y ( t ) - вектор положения частицы в момент времени t ; тогда производная y ′ ( t ) - это вектор скорости частицы в момент времени t .

Частные производные [ править ]

Предположим, что f - функция, которая зависит от более чем одной переменной, например,

f можно интерпретировать как семейство функций одной переменной, индексированных другими переменными:

Другими словами, каждое значение x выбирает функцию, обозначенную f x , которая является функцией одного действительного числа. [Примечание 3] То есть

После того, как значение х выбран, скажем , , то F ( х , у ) определяет функцию F , который посылает у к в 2 + ау + у 2 :

В этом выражении a - константа , а не переменная , поэтому f a - функция только одной действительной переменной. Следовательно, применяется определение производной для функции одной переменной:

Вышеупомянутая процедура может быть выполнена для любого выбора a . Объединение производных вместе в функцию дает функцию, которая описывает изменение f в направлении y :

Это частная производная f по y . Здесь - округленная буква d, называемая символом частной производной . Чтобы отличить его от буквы d , ∂ иногда произносится как «der», «del» или «частично» вместо «dee».

В общем, частная производная функции f ( x 1 ,…, x n ) по направлению x i в точке ( a 1 , ..., a n ) определяется как:

В приведенном выше коэффициенте разницы все переменные, кроме x i, остаются фиксированными. Этот выбор фиксированных значений определяет функцию одной переменной

и по определению

Другими словами, различные выборы в индексе семейства функций одной переменной так же , как в приведенном выше примере. Это выражение также показывает, что вычисление частных производных сводится к вычислению производных с одной переменной.

Это фундаментально для изучения функций нескольких действительных переменных . Пусть f ( x 1 , ..., x n ) - такая вещественная функция . Если все частные производные f / ∂ x j функции f определены в точке a = ( a 1 , ..., a n ) , эти частные производные определяют вектор

который называется градиентом от F на . Если f дифференцируема в каждой точке некоторой области, то градиент - это вектор-функция f, которая отображает точку ( a 1 , ..., a n ) в вектор f ( a 1 , ..., а п ) . Следовательно, градиент определяет векторное поле .

Направленные производные [ править ]

Если f - вещественная функция на R n , то частные производные f измеряют ее изменение в направлении осей координат. Например, если f является функцией x и y , то его частные производные измеряют изменение f в направлении x и направлении y . Однако они не измеряют напрямую изменение f в любом другом направлении, например, вдоль диагональной линии y = x . Они измеряются с использованием производных по направлению. Выберите вектор

Производная по направлению от F в направлении V в точке х есть предел

В некоторых случаях может быть проще вычислить или оценить производную по направлению после изменения длины вектора. Часто это делается, чтобы превратить задачу в вычисление производной по направлению в направлении единичного вектора. Чтобы увидеть, как это работает, предположим, что v = λ u . Подставляем h = k / λ в разностное отношение. Коэффициент разницы становится:

Это λ умноженное на разностное отношение производной функции f по u по направлению . Более того, принятие предела, когда h стремится к нулю, аналогично принятию предела, когда k стремится к нулю, потому что h и k кратны друг другу. Следовательно, D v ( f ) = λ D u ( f ) . Из-за этого свойства масштабирования производные по направлению часто рассматриваются только для единичных векторов.

Если все частные производные функции f существуют и непрерывны в точке x , то они определяют производную функции f по направлению v по формуле:

Это следствие определения полной производной . Отсюда следует, что производная по направлению линейна по v , что означает, что D v + w ( f ) = D v ( f ) + D w ( f ) .

То же определение работает, когда f - функция со значениями в R m . Приведенное выше определение применяется к каждому компоненту векторов. В этом случае производная по направлению является вектором в R m .

Полная производная, полный дифференциал и матрица Якоби [ править ]

Когда f является функцией от открытого подмножества R n до R m , тогда производная f по направлению в выбранном направлении является наилучшим линейным приближением к f в этой точке и в этом направлении. Но когда n > 1 , никакая производная по направлению не может дать полную картину поведения f . Полная производная дает полную картину, учитывая сразу все направления. То есть для любого вектора v, начинающегося с a , верна формула линейного приближения:

Как и производная с одной переменной, f  ′ ( a ) выбирается так, чтобы ошибка в этом приближении была как можно меньше.

Если n и m оба равны единице, то производная f  '( a ) является числом, а выражение f  ' ( a ) v является произведением двух чисел. Но в более высоких измерениях f  ′ ( a ) не может быть числом. Если бы это было число, то f  '( a ) v было бы вектором в R n, в то время как другие члены были бы векторами в R m , и поэтому формула не имела бы смысла. Чтобы формула линейного приближения имела смысл, f  ′ (a ) должна быть функцией, которая отправляет векторы в R n векторам в R m , а f  '( a ) v должна обозначать эту функцию, вычисленную в v .

Чтобы определить, что это за функция, обратите внимание, что формулу линейного приближения можно переписать как

Обратите внимание , что если мы выберем другой вектор ш , то это приближенное уравнение определяет другое приближенное уравнение, заменяя ш на V . Она определяет третье приближенное уравнение, заменяя как ш для V и на + V для . Вычитая эти два новых уравнения, мы получаем

Если предположить, что v мало, а производная непрерывно изменяется в a , то f  ′ ( a + v ) приблизительно равно f  ′ ( a ) , и, следовательно, правая часть приблизительно равна нулю. Левую часть можно переписать по-другому, используя формулу линейной аппроксимации с заменой v + w на v . Из формулы линейного приближения следует:

Это предполагает, что f  ′ ( a ) является линейным преобразованием из векторного пространства R n в векторное пространство R m . Фактически, это можно сделать точным выводом, измерив погрешность приближений. Предположим, что ошибка в этой формуле линейного приближения ограничена постоянным временем || v ||, где постоянная не зависит от v, но непрерывно зависит от a . Затем, после добавления соответствующего члена ошибки, все приведенные выше приблизительные равенства можно перефразировать как неравенства. В частности, f  ′ ( a )является линейным преобразованием с точностью до малой погрешности. Следовательно, в пределе, когда v и w стремятся к нулю, это должно быть линейное преобразование. Поскольку мы определяем полную производную, взяв предел при стремлении v к нулю, f  ′ ( a ) должно быть линейным преобразованием.

В одной переменной тот факт, что производная является наилучшим линейным приближением, выражается тем фактом, что это предел разностных отношений. Однако обычный коэффициент разности не имеет смысла в более высоких измерениях, потому что обычно невозможно разделить векторы. В частности, числитель и знаменатель разностного частного даже не находятся в одном и том же векторном пространстве: числитель находится в области R m, а знаменатель - в области R n . Кроме того, производная - это линейное преобразование, объект, отличный от числителя и знаменателя. Чтобы уточнить идею о том, что f  ′ ( a )является наилучшим линейным приближением, необходимо адаптировать другую формулу для производной с одной переменной, в которой эти проблемы исчезают. Если f  : RR , то обычным определением производной можно манипулировать, чтобы показать, что производная f в точке a - это уникальное число f  ′ ( a ) такое, что

Это эквивалентно

потому что предел функции стремится к нулю тогда и только тогда, когда предел абсолютного значения функции стремится к нулю. Эту последнюю формулу можно адаптировать к ситуации с множеством переменных, заменив абсолютные значения нормами .

Следовательно, определение полной производной функции f в точке a состоит в том, что это единственное линейное преобразование f  ′ ( a ): R nR m такое, что

Здесь h - вектор в R n , поэтому норма в знаменателе - это стандартная длина на R n . Однако f ′ ( a ) h является вектором в R m , а норма в числителе - это стандартная длина на R m . Если v - вектор, начинающийся в a , то f  ′ ( a ) v называется прямым направлением v посредством f и иногда обозначается как f v .

Если полная производная существует в a , то все частные производные и производные по направлениям f существуют в a , и для всех v , f  ′ ( a ) v является производной по направлению f в направлении v . Если мы запишем f с использованием координатных функций, так что f = ( f 1 , f 2 , ..., f m ) , тогда полная производная может быть выражена с использованием частных производных в виде матрицы . Эта матрица называетсяМатрица Якоби функции f в точке a :

Существование полной производной F '( в ) строго сильнее , чем существование всех частных производных, но если частные производные существуют и непрерывны, то полная производная существует, то дается якобиан, и непрерывно зависит от а .

Определение полной производной включает определение производной одной переменной. То есть, если f является действительной функцией действительной переменной, то полная производная существует тогда и только тогда, когда существует обычная производная. Матрица Якоби сводится к матрице 1 × 1, единственным элементом которой является производная f ′ ( x ). Эта матрица 1 × 1 удовлетворяет тому свойству, что f ( a + h ) - ( f ( a ) + f  ′ ( a ) h ) приблизительно равно нулю, другими словами, что

Вплоть до замены переменных, это утверждение, что функция является наилучшим линейным приближением к f в точке a .

Полная производная функции не дает другую функцию так же, как в случае одной переменной. Это связано с тем, что полная производная функции многих переменных должна записывать гораздо больше информации, чем производная функции одной переменной. Вместо этого полная производная дает функцию от касательного пучка источника к касательному пучку цели.

Естественный аналог полных производных второго, третьего и более высоких порядков не является линейным преобразованием, не является функцией на касательном расслоении и не строится путем многократного взятия полной производной. Аналог производной более высокого порядка, называемый струей , не может быть линейным преобразованием, поскольку производные более высокого порядка отражают тонкую геометрическую информацию, такую ​​как вогнутость, которую нельзя описать в терминах линейных данных, таких как векторы. Это не может быть функцией касательного расслоения, потому что касательное расслоение имеет место только для базового пространства и производных по направлениям. Поскольку струи захватывают информацию более высокого порядка, они принимают в качестве аргументов дополнительные координаты, представляющие изменения направления более высокого порядка. Пространство, определяемое этими дополнительными координатами, называетсяструйный пучок . Связь между полной производной и частными производными функции аналогична соотношению между струей k- го порядка функции и ее частными производными порядка, меньшего или равного k .

Повторно взяв полную производную, можно получить более высокие версии производной Фреше , специализированные для R p . К - го порядка полной производной может быть интерпретирован как карта

который берет точку x в R n и присваивает ей элемент пространства k -линейных отображений из R n в R m - «наилучшее» (в определенном точном смысле) k- линейное приближение к f в этой точке. Предварительно составив его с диагональным отображением Δ, x → ( x , x ) , можно начать обобщенный ряд Тейлора как

где f ( a ) отождествляется с постоянной функцией, x i - a i - компоненты вектора x - a , а ( Df ) i и ( D 2 f ) jk - компоненты Df и D 2 f как линейные трансформации.

Обобщения [ править ]

Концепция производной может быть расширена на многие другие параметры. Общей нитью является то, что производная функции в точке служит линейным приближением функции в этой точке.

  • Важное обобщение производных проблем сложных функций от комплексных переменных , таких , как функции от (область в) комплексные числа C к C . Понятие производной такой функции получается заменой вещественных переменных комплексными переменными в определении. Если С идентифицируются с R 2 , написав комплексное число г , как х + гу , то дифференцируемая функция от С до С , безусловно , дифференцируемой как функцией от R 2 до R -(в том смысле, что все его частные производные существуют), но в целом обратное неверно: комплексная производная существует только в том случае, если действительная производная является комплексной линейной, и это налагает связи между частными производными, называемые уравнениями Коши – Римана - см. голоморфные функции .
  • Другое обобщение касается функций между дифференцируемыми или гладкими многообразиями . Интуитивно говоря, такое многообразие M - это пространство, которое можно аппроксимировать около каждой точки x векторным пространством, называемым его касательным пространством : прототипным примером является гладкая поверхность в R 3 . Производная (или дифференциал) (дифференцируемого) отображения f : MN между многообразиями в точке x в M , тогда является линейным отображением касательного пространства M в точке x в касательное пространство многообразияN в точке f ( x ). Производная функция становится отображением между касательных расслоений из М и N . Это определение является фундаментальным в дифференциальной геометрии и имеет множество применений - см. Прямое движение вперед (дифференциал) и откат (дифференциальная геометрия) .
  • Дифференцирование также может быть определено для отображений между бесконечномерными векторными пространствами, такими как пространства Банаха и пространства Фреше . Существует обобщение как производной по направлению, называемой производной Гато , так и дифференциала, называемой производной Фреше .
  • Один из недостатков классической производной состоит в том, что очень многие функции не дифференцируемы. Тем не менее, есть способ расширить понятие производной, чтобы все непрерывные функции и многие другие функции можно было дифференцировать с использованием концепции, известной как слабая производная . Идея состоит в том, чтобы встроить непрерывные функции в большее пространство, называемое пространством распределений, и потребовать только, чтобы функция была дифференцируемой «в среднем».
  • Свойства производной вдохновили на введение и изучение многих подобных объектов в алгебре и топологии - см., Например, дифференциальную алгебру .
  • Дискретный эквивалент дифференцирования - конечные разности . Изучение дифференциального исчисления объединено с исчислением конечных разностей в исчислении шкалы времени .
  • Также см. Арифметическую производную .

История [ править ]

Исчисление , известное в своей ранней истории как исчисление бесконечно малых , представляет собой математическую дисциплину, ориентированную на пределы , функции , производные, интегралы и бесконечные ряды . Исаак Ньютон и Готфрид Лейбниц независимо друг от друга открыли исчисление в середине 17 века. Однако каждый изобретатель утверждал, что другой украл его работу, в ожесточенном споре, который продолжался до конца их жизни.

См. Также [ править ]

  • Приложения деривативов
  • Автоматическая дифференциация
  • Класс дифференцируемости
  • Правила дифференциации
  • Дифферинтегральный
  • Фрактальная производная
  • Обобщения производной
  • Производная Хассе
  • История исчисления
  • интеграл
  • Бесконечно малый
  • Линеаризация
  • Математический анализ
  • Мультипликативный обратный
  • Численное дифференцирование
  • Оценить (математика)
  • Теорема Радона – Никодима
  • Симметричная производная
  • Производная Шварца

Примечания [ править ]

  1. ^ Дифференциальное исчисление, как обсуждается в этой статье, является очень хорошо известной математической дисциплиной, для которой существует множество источников. См. Апостол 1967, Апостол 1969 и Спивак 1994.
  2. ^ При формулировке исчисления в терминах пределовсимволу du разными авторами приписывались различные значения. Некоторые авторы не придают значение du само по себе, а только как часть символа du / dx . Другие определяют dx как независимую переменную и определяют du как du = dxf ( x ) . В нестандартном анализе du определяется как бесконечно малое. Он также интерпретируется как внешняя производная функции u . Видетьдифференциал (бесконечно малый) для получения дополнительной информации.
  3. ^ Это также можно выразить как операцию каррирования .

Ссылки [ править ]

  1. ^ Weisstein, Eric W. "Overdot." Материализ MathWorld - веб-ресурса Wolfram. «Архивная копия» . Архивировано 5 сентября 2015 года . Проверено 5 февраля 2016 .CS1 maint: archived copy as title (link)
  2. ^ Вайсштейн, Эрик В. «Двойная точка». Материализ MathWorld - веб-ресурса Wolfram. «Архивная копия» . Архивировано 3 марта 2016 года . Проверено 5 февраля 2016 .CS1 maint: archived copy as title (link)
  3. Спивак, 1994, глава 10.
  4. ^ Банахово, С. (1931), "Убер умереть Baire'sche Kategorie gewisser Funktionenmengen" , Studia Math. , 3 (3): 174-179, DOI : 10,4064 / см-3-1-174-179 .. Цитируется Hewitt, E; Стромберг, К. (1963), Реальный и абстрактный анализ , Springer-Verlag, теорема 17.8
  5. ^ Apostol 1967 , §4.18
  6. Рукопись от 11 ноября 1675 г. (Каджори, том 2, страница 204)
  7. ^ «Обозначение дифференциации» . Массачусетский технологический институт. 1998 . Проверено 24 октября 2012 года .
  8. ^ Эванс, Лоуренс (1999). Уравнения с частными производными . Американское математическое общество. п. 63. ISBN 0-8218-0772-2.
  9. ^ Kreyszig, Эрвин (1991). Дифференциальная геометрия . Нью-Йорк: Дувр. п. 1. ISBN 0-486-66721-9.

Библиография [ править ]

Распечатать [ редактировать ]

  • Антон, Ховард; Бивенс, Ирландия; Дэвис, Стивен (2 февраля 2005 г.), Calculus: Early Transcendentals Single and Multivariable (8-е изд.), Нью-Йорк: Wiley, ISBN 978-0-471-47244-5
  • Апостол, Том М. (июнь 1967), Calculus, Vol. 1: Исчисление одной переменной с введением в линейную алгебру , 1 (2-е изд.), Wiley, ISBN 978-0-471-00005-1
  • Апостол, Том М. (июнь 1969 г.), Calculus, Vol. 2. Исчисление с несколькими переменными и линейная алгебра с приложениями , 1 (2-е изд.), Wiley, ISBN 978-0-471-00007-5
  • Курант, Ричард; Джон, Фриц (22 декабря 1998 г.), Introduction to Calculus and Analysis, Vol. 1 , Springer-Verlag, ISBN 978-3-540-65058-4
  • Ивс, Ховард (2 января 1990 г.), Введение в историю математики (6-е изд.), Брукс Коул, ISBN 978-0-03-029558-4
  • Ларсон, Рон; Хостетлер, Роберт П .; Эдвардс, Брюс Х. (28 февраля 2006 г.), Исчисление: ранние трансцендентные функции (4-е изд.), Houghton Mifflin Company, ISBN 978-0-618-60624-5
  • Спивак, Майкл (сентябрь 1994), Calculus (3-е изд.), Publish or Perish, ISBN 978-0-914098-89-8
  • Стюарт, Джеймс (24 декабря 2002 г.), Исчисление (5-е изд.), Брукс Коул, ISBN 978-0-534-39339-7
  • Томпсон, Сильванус П. (8 сентября 1998 г.), Calculus Made Easy (пересмотренное, обновленное, расширенное издание), Нью-Йорк: издательство St. Martin's Press, ISBN 978-0-312-18548-0

Интернет-книги [ править ]

  • Кроуэлл, Бенджамин (2017), Основы исчисления
  • (Правительство штата Теннесси), TamilNadu Textbook Corporation (2006), Mathematics- vol.2 (PDF) , заархивировано из оригинала (PDF) 15 января 2016 г. , получено 29 ноября 2014 г.
  • Гаррет, Пол (2004), Заметки по расчету на первом году обучения , Университет Миннесоты
  • Хуссейн, Фараз (2006), Понимание исчисления
  • Кейслер, Х. Джером (2000), Элементарное исчисление: подход с использованием бесконечно малых
  • Маух, Шон (2004), Несокращенная версия книги Шона по прикладной математике , заархивировано из оригинала 15 апреля 2006 г.
  • Слаутер, Дэн (2000), Разностные уравнения к дифференциальным уравнениям
  • Стрэнг, Гилберт (1991), Расчет
  • Строян , Кейт Д. (1997), Краткое введение в исчисление бесконечно малых
  • Викиучебники, Исчисление

Внешние ссылки [ править ]

  • "Производная" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Академия Хана : «Ньютон, Лейбниц и Усэйн Болт»
  • Вайсштейн, Эрик В. «Производная» . MathWorld .
  • Онлайн-калькулятор производных от Wolfram Alpha .