Change of variables and chain rule in diﬀerential equation

And we are asked to do change of variables from \(x\) to \(z\) where \(z=g\left ( x\right ) \). In this, we can also write

Where \(g^{-1}\left ( z\right ) \) is the inverse function. Using chain rule gives

And now we use the product rule, which is \(\frac {d}{dx}\left ( ab\right ) =a^{\prime }b+ab^{\prime }\) on the above, which gives

Let us do each of the terms on the right above one by one. The second term on the RHS above is easy. It is

It is the ﬁrst term in (1) which needs more care. The problem is how to handle \(\frac {d}{dx}\frac {dy}{dz}\)? Since the denominators are diﬀerent. The trick is to write \(\frac {d}{dx}\frac {dy}{dz}\) as \(\frac {d}{dz}\frac {dz}{dx}\left ( \frac {dy}{dz}\right ) \) which does not change anything, but now we can change the order and write this as \(\frac {dz}{dx}\frac {d}{dz}\left ( \frac {dy}{dz}\right ) \) which now makes the denominator the same and now it is free sailing:

\begin{align} \left ( \frac {d}{dx}\frac {dy}{dz}\right ) \left ( \frac {dz}{dx}\right ) & =\frac {dz}{dx}\left ( \frac {d^{2}y}{dz^{2}}\right ) \left ( \frac {dz}{dx}\right ) \nonumber \\ & =\left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) \tag {3}\end{align}

\begin{align*} \frac {d^{2}y}{dx^{2}}+\frac {dy}{dx}+y & =\sin \left ( x\right ) \\ \overset {y^{\prime \prime }\left ( x\right ) }{\overbrace {\left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) +\left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}z}{dx^{2}}\right ) }}+\overset {y^{\prime }\left ( x\right ) }{\overbrace {\frac {dy}{dz}\frac {dz}{dx}}}+y\left ( z\right ) & =\sin \left ( g^{-1}\left ( z\right ) \right ) \end{align*}

We could have written the RHS above as just \(\sin \left ( x\right ) \) instead of \(\sin \left ( g^{-1}\left ( z\right ) \right ) \) but since the independent variable is now \(z\), this seemed better to do it this way. But both are correct. Now, since \(z=g\left ( x\right ) \) the above can also be written as

\begin{align*} \left ( \frac {dg}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) +\left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}g}{dx^{2}}\right ) +\frac {dy}{dz}\frac {dg}{dx}+y\left ( z\right ) & =\sin \left ( g^{-1}\left ( z\right ) \right ) \\ \left ( g^{\prime }\left ( x\right ) \right ) ^{2}y^{\prime \prime }\left ( x\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime }\left ( x\right ) +y^{\prime }\left ( z\right ) g^{\prime }\left ( x\right ) +y\left ( z\right ) & =\sin \left ( x\right ) \end{align*}

OK, since the above was so much fun, lets do third derivative \(\frac {d^{3}y}{dx^{3}}\)

\begin{align} \frac {d^{3}y}{dx^{3}} & =\frac {d}{dx}\left ( \frac {d^{2}y}{dx^{2}}\right ) \nonumber \\ & =\frac {d}{dx}\left ( \left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) +\left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}z}{dx^{2}}\right ) \right ) \nonumber \\ & =\frac {d}{dx}\left [ \left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) \right ] +\frac {d}{dx}\left [ \left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}z}{dx^{2}}\right ) \right ] \tag {4}\end{align}

Using the product rule, which is \(\frac {d}{dx}\left ( ab\right ) =a^{\prime }b+ab^{\prime }\) on the above gives

\[ \frac {d}{dx}\left [ \left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) \right ] =\frac {d}{dx}\left [ \left ( \frac {dz}{dx}\right ) ^{2}\right ] \frac {d^{2}y}{dz^{2}}+\left ( \frac {dz}{dx}\right ) ^{2}\frac {d}{dx}\left [ \frac {d^{2}y}{dz^{2}}\right ] \]

But \(\frac {d}{dx}\left [ \left ( \frac {dz}{dx}\right ) ^{2}\right ] =2\frac {dz}{dx}\frac {d^{2}z}{dx}\) and for \(\frac {d}{dx}\left ( \frac {d^{2}y}{dz^{2}}\right ) \) we have to use the same trick as before by writing \(\frac {d}{dx}\left ( \frac {d^{2}y}{dz^{2}}\right ) =\frac {d}{dz}\frac {dz}{dx}\left ( \frac {d^{2}y}{dz^{2}}\right ) =\frac {dz}{dx}\frac {d}{dz}\left ( \frac {d^{2}y}{dz^{2}}\right ) \) and now we have \(\frac {d}{dx}\left ( \frac {d^{2}y}{dz^{2}}\right ) =\frac {dz}{dx}\frac {d^{3}y}{dz^{3}}\). Hence the ﬁrst term in (4) is now done.

\begin{align} \frac {d}{dx}\left [ \left ( \frac {dz}{dx}\right ) ^{2}\left ( \frac {d^{2}y}{dz^{2}}\right ) \right ] & =2\frac {dz}{dx}\frac {d^{2}z}{dx^{2}}\frac {d^{2}y}{dz^{2}}+\left ( \frac {dz}{dx}\right ) ^{2}\frac {dz}{dx}\frac {d^{3}y}{dz^{3}}\nonumber \\ & =2\frac {dz}{dx}\frac {d^{2}z}{dx^{2}}\frac {d^{2}y}{dz^{2}}+\left ( \frac {dz}{dx}\right ) ^{3}\frac {d^{3}y}{dz^{3}} \tag {5}\end{align}

Now we look at the second term in (4) which is \(\frac {d}{dx}\left [ \left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}z}{dx^{2}}\right ) \right ] \) and apply the product rule, this gives

\begin{align} \frac {d}{dx}\left [ \left ( \frac {dy}{dz}\right ) \left ( \frac {d^{2}z}{dx^{2}}\right ) \right ] & =\frac {d}{dx}\left [ \frac {dy}{dz}\right ] \left ( \frac {d^{2}z}{dx^{2}}\right ) +\frac {dy}{dz}\frac {d}{dx}\left [ \frac {d^{2}z}{dx^{2}}\right ] \nonumber \\ & =\frac {d}{dz}\frac {dz}{dx}\left [ \frac {dy}{dz}\right ] \left ( \frac {d^{2}z}{dx^{2}}\right ) +\frac {dy}{dz}\frac {d^{3}z}{dx^{3}}\nonumber \\ & =\frac {dz}{dx}\frac {d}{dz}\left [ \frac {dy}{dz}\right ] \left ( \frac {d^{2}z}{dx^{2}}\right ) +\frac {dy}{dz}\frac {d^{3}z}{dx^{3}}\nonumber \\ & =\frac {dz}{dx}\frac {d^{2}y}{dz^{2}}\left ( \frac {d^{2}z}{dx^{2}}\right ) +\frac {dy}{dz}\frac {d^{3}z}{dx^{3}} \tag {6}\end{align}

\begin{align*} \frac {d^{3}y}{dx^{3}} & =2\frac {dz}{dx}\frac {d^{2}z}{dx^{2}}\frac {d^{2}y}{dz^{2}}+\left ( \frac {dz}{dx}\right ) ^{3}\frac {d^{3}y}{dz^{3}}+\frac {dz}{dx}\frac {d^{2}y}{dz^{2}}\left ( \frac {d^{2}z}{dx^{2}}\right ) +\frac {dy}{dz}\frac {d^{3}z}{dx^{3}}\\ & =3\frac {dz}{dx}\frac {d^{2}z}{dx^{2}}\frac {d^{2}y}{dz^{2}}+\left ( \frac {dz}{dx}\right ) ^{3}\frac {d^{3}y}{dz^{3}}+\frac {dy}{dz}\frac {d^{3}z}{dx^{3}}\end{align*}

\[ y^{\prime \prime \prime }\left ( x\right ) =3g^{\prime }\left ( x\right ) g^{\prime \prime }\left ( x\right ) y^{\prime \prime }\left ( z\right ) +\left ( g^{\prime }\left ( x\right ) \right ) ^{3}y^{\prime \prime \prime }\left ( z\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime \prime }\left ( x\right ) \]

This table show summary of transformation for each derivative \(y^{\left ( n\right ) }\left ( x\right ) \) when using change of variables \(z=g\left ( x\right ) \)


\(y^{\prime }\left ( x\right ) \)	\(y^{\prime }\left ( z\right ) g^{\prime }\left ( x\right ) \)

\(y^{\prime \prime }\left ( x\right ) \)	\(\left ( g^{\prime }\left ( x\right ) \right ) ^{2}y^{\prime \prime }\left ( z\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime }\left ( x\right ) \)

\(y^{\prime \prime \prime }\left ( x\right ) \)	\(3g^{\prime }\left ( x\right ) g^{\prime \prime }\left ( x\right ) y^{\prime \prime }\left ( z\right ) +\left ( g^{\prime }\left ( x\right ) \right ) ^{3}y^{\prime \prime \prime }\left ( z\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime \prime }\left ( x\right ) \)

\(y^{\prime \prime \prime \prime }\left ( x\right ) \)	\(3\left ( g^{\prime \prime }\left ( x\right ) \right ) ^{2}y^{\prime \prime }\left ( z\right ) +4g^{\prime }\left ( x\right ) y^{\prime \prime }\left ( z\right ) g^{\prime \prime \prime }\left ( x\right ) +6\left ( g^{\prime }\left ( x\right ) \right ) ^{2}g^{\prime \prime }\left ( x\right ) y^{\prime \prime \prime }\left ( z\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime \prime \prime }\left ( x\right ) +\left ( g^{\prime }\left ( x\right ) \right ) ^{4}y^{\prime \prime \prime \prime }\left ( z\right ) \)

Strictly speaking, it would be better to use diﬀerent variable than \(y\) when changing the independent variable. i.e. instead of writing \(y\left ( z\right ) \) in all the above, we should write \(u\left ( z\right ) \) in its place. So the above table will look like


\(y^{\prime }\left ( x\right ) \)	\(u^{\prime }\left ( z\right ) g^{\prime }\left ( x\right ) \)

\(y^{\prime \prime }\left ( x\right ) \)	\(\left ( g^{\prime }\left ( x\right ) \right ) ^{2}u^{\prime \prime }\left ( z\right ) +u^{\prime }\left ( z\right ) g^{\prime \prime }\left ( x\right ) \)

\(y^{\prime \prime \prime }\left ( x\right ) \)	\(3g^{\prime }\left ( x\right ) g^{\prime \prime }\left ( x\right ) u^{\prime \prime }\left ( z\right ) +\left ( g^{\prime }\left ( x\right ) \right ) ^{3}u^{\prime \prime \prime }\left ( z\right ) +u^{\prime }\left ( z\right ) g^{\prime \prime \prime }\left ( x\right ) \)

\(y^{\prime \prime \prime \prime }\left ( x\right ) \)	\(3\left ( g^{\prime \prime }\left ( x\right ) \right ) ^{2}u^{\prime \prime }\left ( z\right ) +4g^{\prime }\left ( x\right ) u^{\prime \prime }\left ( z\right ) g^{\prime \prime \prime }\left ( x\right ) +6\left ( g^{\prime }\left ( x\right ) \right ) ^{2}g^{\prime \prime }\left ( x\right ) u^{\prime \prime \prime }\left ( z\right ) +y^{\prime }\left ( z\right ) g^{\prime \prime \prime \prime }\left ( x\right ) +\left ( g^{\prime }\left ( x\right ) \right ) ^{4}u^{\prime \prime \prime \prime }\left ( z\right ) \)

So any place where \(y\left ( z\right ) \) shows in the transformed expression, it should be written with new letter for the dependent variable \(u\left ( z\right ) \). But this is not always enforced.

4.2 Example 2 Change of the independent variable using \(t=\ln \left ( x\right ) \) Euler ode

\begin{align*} \frac {d^{2}y}{dx^{2}} & =\frac {d}{dx}\left ( \frac {dy}{dx}\right ) \\ & =\frac {d}{dx}\left ( \frac {dy}{dt}\frac {1}{x}\right ) \\ & =\frac {d}{dx}\left [ \frac {dy}{dt}\right ] \frac {1}{x}+\frac {dy}{dt}\frac {d}{dx}\left ( \frac {1}{x}\right ) \\ & =\frac {d}{dt}\frac {dt}{dx}\left [ \frac {dy}{dt}\right ] \frac {1}{x}-\frac {dy}{dt}\frac {1}{x^{2}}\\ & =\frac {dt}{dx}\frac {d^{2}y}{dt^{2}}\frac {1}{x}-\frac {dy}{dt}\frac {1}{x^{2}}\\ & =\frac {1}{x}\frac {d^{2}y}{dt^{2}}\frac {1}{x}-\frac {dy}{dt}\frac {1}{x^{2}}\\ & =\frac {1}{x^{2}}\frac {d^{2}y}{dt^{2}}-\frac {dy}{dt}\frac {1}{x^{2}}\end{align*}

\begin{align*} x^{2}\left ( \frac {1}{x^{2}}\frac {d^{2}y}{dt^{2}}-\frac {dy}{dt}\frac {1}{x^{2}}\right ) +2x\left ( \frac {dy}{dt}\frac {1}{x}\right ) +y & =0\\ \frac {d^{2}y}{dt^{2}}-\frac {dy}{dt}+2\frac {dy}{dt}+y & =0\\ \frac {d^{2}y}{dt^{2}}+\frac {dy}{dt}+y & =0 \end{align*}

4.3 Example 3 Change of the dependent variable using \(y=x^{r}\) Euler ode

Solving for \(r\) gives the roots. Hence solutions are \(y_{1}=x^{r_{1}}\) and \(y_{2}=x^{r_{2}}\). Final solution is therefore

This method of solving the Euler ode is much simpler than using \(t=\ln \left ( x\right ) \) change of variables but for some reason most text books use the later one.

4 Change of variables and chain rule in diﬀerential equation

4.1 Example 1 Change of the independent variable using \(z=g\left ( x\right ) \)

4.2 Example 2 Change of the independent variable using \(t=\ln \left ( x\right ) \) Euler ode

4.3 Example 3 Change of the dependent variable using \(y=x^{r}\) Euler ode