Дифференциальное исчисление

Материал из Юнциклопедии
Перейти к навигации Перейти к поиску

Дифференциальное исчисление — это раздел анализа математического, связанный главным образом с понятиями производной и дифференциала функции. В дифференциальном исчислении изучаются правила вычисления производных (законы дифференцирования) и применения производных к исследованию свойств функций.

Центральные понятия дифференциального исчисления — производная и дифференциал — возникли при рассмотрении большого числа задач естествознания и математики, приводивших к вычислению пределов одного и того же типа. Важнейшие среди них - физическая задача определения скорости неравномерного движения и геометрическая задача построения касательной к кривой. Рассмотрим подробно каждую из них.

Будем вслед за итальянским ученым Г. Галилеем изучать закон свободного падения тел. Поднимем камешек и затем из состояния покоя отпустим его. Пусть t — время, отсчитываемое от начала падения, a s(t) — пройденное к моменту t расстояние. Галилей экспериментально нашел, что зависимость s(t) имеет следующий простой вид:

s(t) = (1/2)gt2,

где t — время в секундах, а g — физическая постоянная, равная примерно 9,8 м/с2.

Движение свободно падающего тела явно неравномерное. Скорость v падения постепенно возрастает. Но как именно выглядит зависимость v(t)? Ясно, что, зная зависимость s(t), т. е. закон движения падающего тела, мы в принципе должны иметь возможность получить отсюда и выражение для скорости v(t) как функции времени.

Попробуем найти зависимость v от t. Будем рассуждать следующим образом: фиксируем момент t, в который мы хотим знать значение скорости v(t). Пусть h - небольшой промежуток времени, прошедший от момента t. За это время падающее тело пройдет путь, равный s(t + h) - s(t). Если промежуток времени h очень маленький, то скорость тела за время h не успевает заметно измениться, поэтому можно считать, что если h мало, то приближенно

s(t + h)-s(t) ≈ v(t)•h, (1)

или

(s(t + h)-s(t))/h ≈ u(t) (2)

причем последнее приближенное равенство тем точнее, чем меньше h (чем ближе величина h к нулю). Значит, величину v(t) скорости в момент t можно рассматривать как предел, к которому стремится стоящее в левой части приближенного равенства (2) отношение, выражающее среднюю скорость на интервале времени от момента t до момента t + h, когда величина h стремится к нулю. Сказанное записывают в виде

v(t) = limh→∞ (s(t + h) - s(t))/h. (2)

Проведем указанные в соотношении (3) вычисления, исходя из найденной Галилеем зависимости

s(t) = (1/2)gt2.

Сделаем сначала элементарные вычисления:

s(t + h) - s(t) = (1/2)g(t + h)2 - (1/2)gt2 = (1/2)g(t2 + 2th + ht2) - (1/2)gt2 = gth + (1/2)gh2.;

а теперь, разделив на h, получаем

(s(t + h) - s(t))/h = gt + (1/2)gh.

Когда h стремится к нулю, второе слагаемое записанной справа суммы тоже стремится к нулю, а первое остается постоянным, точнее, не зависящим от величины h, поэтому в нашем случае

v(t) = limh→∞ ((1/2)g(t + h)2 - (1/2)gt2)/h = gt,

и мы нашли закон

v(t) = gt

изменения скорости свободно падающего тела. Обратите внимание, формула (3) одновременно дает и определение, и правило вычисления значений v(t) мгновенной скорости изменения функции s(t).

Поскольку скорость v(t) сама есть функция времени, то можно было бы поставить вопрос о скорости ее изменения. В физике скорость изменения скорости называется ускорением. Таким образом, если v(t) - скорость как функЦия времени, то, рассуждая как и при выводе формулы (3), для мгновенного ускорения а (г) в момент времени t получаем выражение

a(t) = limh→0 (v(t + h) - v(t))/4. (4)

Посмотрим, что дает эта формула для случая свободного падения, в котором, как мы вычислили, v(t) = gt:

v(t + h) - v(t) = g(t + h)-gt = gh,

(v(t + h) - v(t))/h = g,

и, поскольку g — постоянная, то из (4) получается, что a (f) = д, т. е. ускорение свободно падающего тела постоянно и величина д есть та самая физическая постоянная, которая выражает ускорение свободного падения у поверхности Земли.

Нетрудно заметить полное сходство выражений (3), (4) и понять, что мы нашли общее математическое выражение для мгновенной скорости изменения переменной величины. Конечно, результат вычислений по формулам (3), (4), как мы убедились, зависит от конкретного вида функций s(t) или v(t), но сами операции над этими функциями, которые предписываются правыми частями формул (3), (4), одни и те же.

Обобщая сделанные наблюдения, в математическом анализе уже для любой функции у=f(х) рассматривают важную величину:

f'(x) = limh→0 (f(x + h)-f(x))/h, (5)

которую называют производной функции f.

Производная, таким образом, играет роль скорости изменения зависимой переменной у по отношению к изменению независимой переменной х; последняя теперь уже не обязана иметь физический смысл времени.

Значение производной f'(х) зависит от значения аргумента х, поэтому, как и в случае скорости, производная f'(x) некоторой функции f(х) сама является функцией переменной x.

Например, если f(x) = x3, то

(f(x + h) - f(x))/h = ((x + h)3 - x3)/h = 3x2 + (3xh + h2);

далее, при h, стремящемся к нулю, величина, стоящая в последних скобках, стремится к нулю, а вся правая часть при этом стремится к значению 3x2. Мы нашли таким образом, что если f(x) = x3, то f'(x) = 3x2.

В формуле (5) величину h разности (x + h) - х называют приращением аргумента функции и часто обозначают символом ∆x (читается: дельта икс), а разность f(x + h) — f(x) обозначают обычно через ∆f (или, более полно через ∆f(x, ∆x)) и называют приращением функции, соответствующим данному приращению аргумента. В этих обозначениях выражение (5) приобретает вид:

f'(x) = lim∆x→0 (f(x, ∆x) - f (x))/∆x,

или

f'(x) = lim∆x→0 ∆a/∆x.

Таким образом, значение f'(x) производной функции f(x) в точке x — это предел отношения приращения функции ∆f(x, ∆x), соответствующего смещению ∆x от точки x, к приращению ∆x аргумента x, когда ∆x стремится к нулю.

Операция нахождения производной функции называется дифференцированием. С физической точки зрения, как мы теперь понимаем, дифференцирование — это определение скорости изменения переменной величины.

В дифференциальном исчислении выводятся производные основных элементарных функций. Укажем, например, что производными функций xα, sin x, cos x являются соответственно функции αxα-1, cos x и -sin x.

В дифференциальном исчислении выводятся также следующие общие правила дифференцирования:

(cf)' = cf' (вынесение постоянного множителя);

(f1 ± f2)' = f'1 ± f'2 (дифференцирование суммы и разности функций);

(f1 • f2)' = f'1 • f2 + f1 • f'2 (дифференцирование произведения функций);

(f1/f2)' = (f'1 • f2 - f1 • f'2)/f22 (дифференцирование частного функций).

Наконец, справедливо также следующее важное правило дифференцирования сложной функции: если y = f(u), а u = φ(x), то производная функции f(φ(x)) равна f'(u)•φ'(x), или (f(φ (x)))' =f'(φ(x))•φ'(x).

Общие законы дифференцирования существенно облегчают отыскание производных, а для любых комбинаций элементарных функций делают дифференцирование столь же доступной операцией, как и арифметические действия для человека, знающего таблицу умножения.

Например, если f(x) = a0 + a1x + a2x2 + ...+ anxn - многочлен, то f'(x) = (a0x0 + a1x1 + a2x2 + ... + anxn = (a2x0)' + (a1x1)' + (a2x2)' + ... + (anxn) = a0(x0)' + a1(x1)' + a2(x2)' + an(xn)' = a0(0•x0-1)' + a1(1•x1-1)' + a2(2•x2-1)' + an(n•xn-1)' = a1 + 2a2x + ... + nanxn-1.

Или если ψ(x) = sin x2, то, полагая f(u) = = sin u, u = φ(x) = x2, получаем, что φ(x) = f(φ(x)) и, значит, ψ'(x) = f'(u)•φ'(x) = cos u•2x = 2x cos x2.

Мы уже отмечали, что к вычислению пределов вида (3), (4), (5), т. е., как теперь можно говорить, к вычислению производной, приводили многие задачи.

Рассмотрим теперь другой классический пример уже чисто геометрического вопроса, который решается в терминах производной,— построение касательной к кривой (см. Касательная).

Требуется построить прямую T(рис. 1), касательную в точке A к кривой - графику функции y = f(x).

Как и в случае определения мгновенной скорости, построение касательной будет сопровождаться уточнением самого понятия касательной.

Пусть (x0, y0) — координаты точки A. Как известно, любая не вертикальная прямая, проходящая через точку А, задается уравнением y = y0 + k•(x - x0), где k = (y - y0)/(x - x0)

так называемый угловой коэффициент прямой, характеризующий ее наклон к горизонтальной оси. В нашем случае y0 = f(x0), поэтому уравнение прямой, проходящей через точку A, имеет вид y = f(x0) + k•(x - x0), и мы хотим выбрать значение коэффициента k так, чтобы прямая была как можно лучше «подогнана» к кривой y = f(x), т. е. лучше всего приближала нашу кривую в окрестности точки A. Значит, мы хотим выбрать k так, чтобы приближенное равенство f(x) ≈ f(x0) + k•(x - x0), или, что то же самое, приближенное равенство

(f(x) - f(x0))/(x - x0) ≈ k,

было возможно более точным при значениях х, близких к x0.

Но это знакомая ситуация и, с точностью до переобозначений x - x0 = h, x = x0 + h, это знакомое нам отношение из формулы (5), следовательно,

k = limx→x0 (f(x) - f(x0))/(x - x0) = limh→0 (f(x0 + h) - f(x0)/h (6)

Итак, найдено уравнение

y = f(x0) + f'(x0) (x - x0) (7)

той прямой, которая наилучшим образом приближает кривую y =f(x) в окрестности точки (x0,f(0)). Эту прямую естественно считать искомой касательной к данной кривой в рассматриваемой точке.

Например, если взять параболу y = x2, т. е. f(x) = x2, то касательная к ней в точке (1; 1) в силу (7) будет задаваться уравнением y = 1 + 2(x - 1), которое можно преобразовать к более компактному виду y = 2x - 1.

Выше мы дали физическую интерпретацию производной как мгновенной скорости, а теперь на основании уравнения касательной (7) можно дать геометрическую трактовку производной. А именно, значение f'(x0) производной f'(x) функции f(x) в фиксированной точке х = х0 есть угловой коэффициент касательной к графику функции y = f(x) в точке (x0,f(x0)).

Это, в частности, означает, что на участках изменения переменной x, на которых f'(x) > 0, функция f(x) возрастает; там, где f'(x) < 0, функция f(x) убывает, а в точках местных максимумов или минимумов функции ее производная должна обращаться в нуль, ибо касательная в этих точках горизонтальна. Ясно также, что если в некоторой точке x = a производная обратилась в нуль, то нельзя спешить с выводом, что это точка максимума или минимума (см. точку a4), ибо знак производной может не измениться при переходе через эту точку, и функция будет продолжать возрастать или убывать. Но если производная меняет свой знак при переходе через эту точку (см. точки a1, a2, a3), то ясно, что при x = a функция будет иметь или местный максимум, если идет смена знака с «+» на «—» (как в точках a1, a3), или местный минимум, если знаки меняются с «—» на «+» (как в точке a2).

Сделанные наблюдения о связи знака или нулей производной с характером монотонности (возрастанием, убыванием) функции или с ее экстремумами (максимумами, минимумами) имеют многочисленные применения.

Попробуем, например, проволокой данной длины огородить такой прямоугольный участок луга, чтобы получить возможно более просторный загон для скота, т.е. среди прямоугольников с заданным периметром 2p (т. е. среди изопериметрических прямоугольников) надо найти тот, который имеет наибольшую площадь.

Если x — длина одной из сторон прямоугольника, то при указанном условии длина другой стороны равна p - x, а площадь прямоугольника равна x (p - x). Надо найти максимальное значение функции f(x) = x(p - x) на отрезке 0 ≤ x ≤ p. Поскольку при x = 0 или x = p функция, очевидно, обращается в нуль (прямоугольник вырождается в отрезок), то максимум достигается при каком-то значении x, лежащем между 0 и p. Как найти это значение?

В соответствии со сделанным выше наблюдением максимум значений функции f(x) может быть лишь при том значении x0, при котором скорость изменения функции равна нулю, т. е. f'(x0) = 0.

Найдем, используя уже проведенные ранее вычисления, производную нашей функции. Поскольку f(x) = px - x2, то f'(x) = p - 2x и f'(x) = p - 2x0 = 0 при x0 = (1/2) p. По самому смыслу задачи при найденном значении аргумента x функция должна иметь именно максимум. Это можно проверить и формально:

f'(x) > 0 при x < (1/2) p и f'(x) < 0 при x > (1/2) p.

Таким образом, мы нашли, что искомым прямоугольником с наибольшей площадью является квадрат, длина стороны которого равна (1/2) p.

Решение единым методом различных задач на отыскание максимальных и минимальных значений функций, или, как их принято называть в математике, задач на отыскание экстремумов, является одним из ранних и вместе с тем наиболее популярных и впечатляющих достижений математического анализа (см. Геометрические задачи на экстремум).

До сих пор, следуя И. Ньютону, в качестве главного понятия дифференциального исчисления мы выделяли производную. Г. В. Лейбниц, другой родоначальник математического анализа, в качестве исходного выбрал понятие дифференциала, которое, как мы увидим, логически равноценно понятию производной, но не совпадает с ним. Лейбниц нашел правила вычисления дифференциалов, равноценные правилам отыскания производных, и назвал развитое им исчисление дифференциальным. Это название и сохранилось. Рассмотренные выше примеры помогут нам достаточно быстро разобраться в следующих, на первый взгляд формальных, но очень важных определениях всего дифференциального исчисления.

Функция y = f(x) называется дифференцируемой при некотором значении х ее аргумента, если приращение ∆f = f(x + h) - f(x) этой функции, отвечающее приращению h = (x + h) - x = ∆x ее аргумента x, можно представить в виде

f(x + h) - f(x) = k(x)•h + α•h, (8)

где k(x) — коэффициент, зависящий только от x, а α - величина, стремящаяся к нулю при h, стремящемся к нулю.

Таким образом,

f(x + h) - f(x) ≈ k(x)•h, (9)

т.е. с точностью до погрешности α•h, малой в сравнении с величиной h приращения аргумента, приращение f(x + h) - f(x) дифференцируемой в точке x функции можно заменить величиной k(x)•h, линейной относительно приращения h аргумента x.

Эта приближающая линейная по h функция k(x)•h называется дифференциалом исходной функции f в точке x и обозначается символом df или, более полно, df(x).

В каждой точке х приближающая линейная функция k(x)•h, вообще говоря, своя, что отмечено зависимостью коэффициента k(x) от x.

Поделив обе части равенства (8) на h и учитывая, что величина α стремится к нулю, когда h стремится к нулю, получаем соотношение:

limh→0 (f(x + h) - f(x))/h, (10)

позволяющее вычислять дифференциальный коэффициент k(x) и показывающее, что он просто-напросто совпадает со значением производной f'(x) функции f(x) в точке x.

Таким образом, если функция дифференцируема в точке x, то в этой точке существует указанный в (10) предел, т.е. в ней существует производная f'(x) и k(x) = f'(x).

Обратно, если у функции f(x) в точке x есть определенная равенством (5) производная, то (f(x + h) - f(x))/h = f(x) + α,

где поправка а стремится к нулю, когда h стремится к нулю. Умножая это равенство на h, получаем

f(x + h) - f(x) - f'(x) = f'(x)•h + α•h, (11)

и значит, функция дифференцируема в точке x.

Итак, мы убедились, что функция имеет дифференциал df = k(x)•h в том, и только в том, случае, когда она имеет производную f'(x), причем df=f'(x)•h. Но дифференциал как линейная по h функция k(x)•h вполне определяется коэффициентом k(x) = f'(x), поэтому отыскание дифференциала функции вполне равносильно отысканию ее производной. Вот почему обе эти операции часто называют одним термином - «дифференцирование», а исчисление называют дифференциальным.

Если вместо h писать ∆x, то вместо df= f'(x)•h можно записать df=f'(x)•∆х. Если взять f(x) = x, то f'(x) = 1 и dx = 1•∆x, поэтому вместо приращения ∆x независимой переменной часто пишут дифференциал dx. В этих обозначениях получается красивая запись df=f'(x)•dx дифференциала функции, от которой Лейбниц и пришел к обозначению df/dx для производной f'(x), рассматривая последнюю как отношение дифференциалов функции и ее аргумента. Заметим, что обозначение f'(x) для производной было введено лишь в 1770 г. французским математиком Ж. Л. Лагранжем, а исходным было обозначение

df/dx или df(x)/dx

Г. Лейбница, которое во многих отношениях настолько удачно, что широко используется и по сей день.

Прежде чем показать, как дифференциал можно использовать в приближенных вычислениях, проследим его геометрическую и физическую интерпретацию.

Если в равенстве (8) вместо x написать x0, то можно считать, что на рис. 1 левой части равенства (8) отвечает отрезок BD (это приращение ∆f функции или приращение ординаты кривой y = f(x)), дифференциалу df=f'(x)•∆x отвечает отрезок CD (это приращение ординаты касательной, приближающей нашу кривую в окрестности точки A), а остатку α•h соответствует отрезок BC, который тем меньше в сравнении с отрезком CD, чем меньше приращение ∆x аргумента. Именно это обстоятельство отражают соотношение (11) и приближенное равенство (9), означающее, что ∆f ≈ df.

На физическом языке, когда f'(x) интерпретируется как скорость в момент x, a f(x + h) - f(x) — как путь, пройденный за промежуток времени h, протекший от момента x, приближенное равенство f(x + h) - f(x) ≈ f'(x)•h означает, что за малое время h скорость мало меняется, поэтому пройденный путь приближенно можно найти, как и в (1), по формуле f(x)•h, выражающей равномерное прямолинейное движение с постоянной скоростью f'(x).

Равенство (11) и вытекающее из него путем переобозначений соотношение

f(x) ≈ f(x0) + f(x0)•(x - x0) (12)

позволяют приближенно находить значения функции f(x) в точках x, близких к некоторой точке x0, в которой уже известны значение f(0) самой функции и значение f'(x0) ее производной.

Например, пусть f(x) = xα и x0 = 1. Тогда f(1)= 1α = 1, f'(x) = αxα-1, f'(1) = α1α-1 = α, поэтому, полагая x = 1 + ∆, из (12) находим следующую формулу (1 + ∆)α ≈ 1 + α•∆ для приближенных вычислений, справедливую для любых (не только целых) значений α, при условии малости величины ∆. По этой формуле

7√1,07 = (1 + 0,07)1/7 ≈ 1 + (1/7)•0,07 = 1,01;

√0,96 = (1 + (-0,04))1/2 ≈ 1 + (1/2)•(-0,04) = 0,98;

(1,05)7 = (1 + 0,05)7 ≈ 1 + 7•0,05 = 1,35.

Важную формулу (12) можно уточнить, если привлечь производные более высоких порядков, которые мы сейчас определим.

Поскольку производная f'(x) функции f(x) сама оказывается функцией аргумента x, то можно поставить вопрос о нахождении производной функции f'(x), т.е. функции (f')'(x), которая обозначается символом f"(x) и называется второй производной исходной функции f(x). Например, если s(t) — закон движения, v(t) = s'(t) — ero скорость, a a(t)=v'(t) — ускорение, то a(t) = s"(t) есть вторая производная функции s(t). Вообще можно определить производные любого порядка: n-я производная функции есть производная от ее (n - 1)-й производной.

Для обозначения производных порядка n обычно используют символы fn(x) или dnf(x)/dx

в отличие от символов f'(x), f"(x), f"'(x) употребляемых только для производных малых порядков (1, 2, 3).

Зная производные функции xα, sin x, cos x, легко проверить по индукции, что производные n-го порядка от этих функций соответственно равны

α(α - 1) ... (α - n + 1)хα-n,

sin(x + nπ/2) , cos(x + nπ/2).

Теперь вернемся к формуле (12), в которой функция f(x) приближенно заменяется стоящим в правой части многочленом 1-й степени относительно x - x0. Оказывается, соотношение (12) является частным случаем общего равенства

f(x) = f(x0) + f'(x0)/1! • (x - x0) + ... + f(n)(x0)/n! • (x - x0)n + rn+1 (13)

называемого формулой Тейлора, в котором о величине rn+1, называемой остаточным членом формулы Тейлора, говорится, например, что ее можно представить в виде:

rn+1 = fn+1(ξ)/(n+1)! • (x - x0)n+1 (14)

похожем на вид предыдущих членов формулы, но только здесь fn+1(x) вычисляется не в точке x0, а в некоторой точке лежащей между x0 и x.

Но этой информации бывает достаточно для вычислительных целей. Так, если f(x) = sin x, а x0 = 0, то вспомнив, что

sinn (x) = sin (x + nπ/2), получаем

|rn+1| = |sin (ξ + (n+1)π/2))/(n+1)! • xn+1| ≤ |x|n+1/(n+1)!.

Значит, если, например, |x| ≤ 1, а n = 6, то |r7| < 10-3 и потому, подставив в (13) f(k)(0) = sin(/kπ/2), находим формулу:

sinx x ≈ x - x3/3! + x5/5!, (15)

позволяющую при любом x из отрезка [-1; 1] вычислить значение sin x с точностью, не худшей, чем 10-3.

Можно проверить, что в рассматриваемом случае rn+1 → 0 при неограниченном увеличении n, поэтому можно предложить такую запись:

sin x = x - x3/3! +x5/5 + x7/7 +...+ (-1)k • x2k+1/(2k+1)! + ... . (16)

Справа в этом равенстве стоит бесконечно много слагаемых, т.е., как говорят, имеется ряд. Равенство (16) понимается, как и вообще сумма ряда, в том смысле, что при любом значении х разность между sin x и суммой конечного числа взятых по порядку слагаемых ряда стремится к нулю, если количество слагаемых неограниченно увеличивается.

Ценность формул вида (15), (16) состоит в том, что они позволяют заменить вычисление значений сложной функции вычислением значений приближающего ее многочлена. Вычисление же значений многочлена сводится к одним арифметическим операциям, которые, например, можно выполнить на электронной вычислительной машине.

Ряд (16) является частным случаем ряда

f(x0) + f'(x0)/1! • (x - x0) + ... + f(n)(x0)/n! • (x - x0)n + ... (17)

который можно написать для любой бесконечно дифференцируемой функции f(x). Он называется рядом Тейлора этой функции (Б. Тейлор (1685—1731) — английский математик). Ряд Тейлора (17) не всегда имеет своей суммой породившую его функцию f(x), поэтому вопрос о сумме ряда Тейлора каждый раз требует определенного исследования, например такого, какое мы сделали выше, оценивая величину остатка rn+1. Такими рассуждениями можно показать, что

cos x = 1 - x2/2! + x4/4 - ... + (-1)k x2k/(2k)! + ...

при любом значении x, а равенство

(1 + x)α = 1 + α/1! • x + α(α-1)/2! • x2 + ... + (α(α-1)...(α-n+1))/n! • xn + ...

имеет место при |x| < 1, если α не целое, и при любом x, если α = n — целое положительное число. Но если α = n, то α(α - 1)...(α - m) = n(n - 1)...(n - m) = 0 при m > n. Значит, при целых положительных n, в частности, получается соотношение:

(1 + x)n = 1 + n/1! • x + n(n - 1)/2! • x2 + ... + (n(n - 1)...(n - n + 1))/n! • xn известное в математике как бином Ньютона (см. Ньютона бином).