Failed to render content. Please refresh the page. Showing plain-text fallback.
"@/ਕੰਪੋਨੈਂਟਸ/ਸੀਟੀਏ" ਤੋਂ ਸੀਟੀਏ ਆਯਾਤ ਕਰੋ
ਡਾਟਾ ਸਾਇੰਸ ਇੰਟਰਵਿਊ ਪ੍ਰਸ਼ਨ: ਡੀਐਸ ਭੂਮਿਕਾਵਾਂ ਲਈ ਪੂਰੀ ਗਾਈਡ (2025)
ਆਖਰੀ ਅੱਪਡੇਟ: ਫਰਵਰੀ 7, 2025
ਮੁੱਖ ਟੇਕਵੇਅ
- ਡਾਟਾ ਸਾਇੰਸ ਇੰਟਰਵਿਊ ਵਿੱਚ ਅੰਕੜੇ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ, ਐਸਕਿਯੂਐਲ ਅਤੇ ਕਾਰੋਬਾਰੀ ਸੂਝ-ਬੂਝ ਸ਼ਾਮਲ ਹਨ
- ਸੰਕਲਪਾਂ ਦਾ ਸਰਲ ਵਰਣਨ ਕਰਨ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਦਾ ਅਭਿਆਸ ਕਰੋ
- ਮਾਸਟਰ ਏ / ਬੀ ਟੈਸਟਿੰਗ, ਪ੍ਰਯੋਗਾਤਮਕ ਡਿਜ਼ਾਈਨ, ਅਤੇ ਕਾਰਨ ਅਨੁਮਾਨ
- ਤਕਨੀਕੀ ਹੁਨਰਾਂ ਅਤੇ ਕਾਰੋਬਾਰੀ ਪ੍ਰਭਾਵ ਦੋਵਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰੋ
- ਕੇਸ ਸਟੱਡੀਜ਼ ਅਤੇ ਉਤਪਾਦ ਸਮਝ ਦੇ ਪ੍ਰਸ਼ਨਾਂ ਵਾਸਤੇ ਤਿਆਰੀ ਕਰੋ
🎯 ਪ੍ਰੋ ਸੁਝਾਅ: ਡੇਟਾ ਸਾਇੰਸ ਇੰਟਰਵਿਊ ਡੇਟਾ ਤੋਂ ਸੂਝ ਕੱਢਣ ਅਤੇ ਕਾਰੋਬਾਰੀ ਫੈਸਲਿਆਂ ਨੂੰ ਚਲਾਉਣ ਦੀ ਤੁਹਾਡੀ ਯੋਗਤਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ. ਗੁੰਝਲਦਾਰ ਸੰਕਲਪਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨ, ਕਾਰੋਬਾਰੀ ਸੂਝ-ਬੂਝ ਦਿਖਾਉਣ ਅਤੇ ਅੰਤ ਤੋਂ ਅੰਤ ਤੱਕ ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ਦੇ ਹੁਨਰਾਂ ਦਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਤ ਕਰੋ.
ਡਾਟਾ ਸਾਇੰਸ ਇੰਟਰਵਿਊ ਢਾਂਚਾ
ਡਾਟਾ ਸਾਇੰਸ ਇੰਟਰਵਿਊ ਵਿੱਚ ਆਮ ਤੌਰ 'ਤੇ ਵੱਖੋ ਵੱਖਰੀਆਂ ਯੋਗਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਵਾਲੇ ਕਈ ਦੌਰ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ:
ਇੰਟਰਵਿਊ ਦੌਰ:
- ਫੋਨ ਸਕ੍ਰੀਨ: ਬੁਨਿਆਦੀ SQL, ਅੰਕੜੇ, ਅਤੇ ਵਿਵਹਾਰ ਸੰਬੰਧੀ ਪ੍ਰਸ਼ਨ
- ਤਕਨੀਕੀ ਇੰਟਰਵਿਊ: ਕੋਡਿੰਗ, ਅੰਕੜੇ, ਐਮਐਲ ਐਲਗੋਰਿਦਮ
- ਕੇਸ ਸਟੱਡੀ: ਕਾਰੋਬਾਰੀ ਸਮੱਸਿਆ ਹੱਲ ਕਰਨਾ ਅਤੇ ਪੇਸ਼ਕਾਰੀ
- ਟੀਮ / ਲੀਡਰਸ਼ਿਪ: ਸਭਿਆਚਾਰਕ ਫਿੱਟ ਅਤੇ ਸਹਿਯੋਗ ਮੁਲਾਂਕਣ
ਮੁਲਾਂਕਣ ਖੇਤਰ:
- ਤਕਨੀਕੀ ਹੁਨਰ: ਐਸਕਿਯੂਐਲ, ਪਾਈਥਨ / ਆਰ, ਅੰਕੜੇ, ਮਸ਼ੀਨ ਲਰਨਿੰਗ
- ਸਮੱਸਿਆ ਹੱਲ ਕਰਨਾ: ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਸੋਚ ਅਤੇ ਵਿਧੀ
- ਕਾਰੋਬਾਰੀ ਸੂਝ-ਬੂਝ: ਕਾਰੋਬਾਰੀ ਪ੍ਰਭਾਵ ਅਤੇ ਤਰਜੀਹਾਂ ਨੂੰ ਸਮਝਣਾ
- ਸੰਚਾਰ: ਗੈਰ-ਤਕਨੀਕੀ ਹਿੱਸੇਦਾਰਾਂ ਨੂੰ ਤਕਨੀਕੀ ਧਾਰਨਾਵਾਂ ਦੀ ਵਿਆਖਿਆ ਕਰਨਾ
ਅੰਕੜੇ ਅਤੇ ਸੰਭਾਵਤ ਪ੍ਰਸ਼ਨ
ਮੁੱਢਲੇ ਅੰਕੜੇ
1. ਟਾਈਪ I ਅਤੇ ਟਾਈਪ II ਗਲਤੀਆਂ ਵਿਚਕਾਰ ਅੰਤਰ ਦੀ ਵਿਆਖਿਆ ਕਰੋ।
ਜਵਾਬ:
- ਟਾਈਪ I ਗਲਤੀ (ਗਲਤ ਸਕਾਰਾਤਮਕ): ਮਨਸੂਖ ਅਨੁਮਾਨ ਨੂੰ ਰੱਦ ਕਰਨਾ ਜਦੋਂ ਇਹ ਸੱਚ ਹੈ (α ਗਲਤੀ)
- ਟਾਈਪ II ਗਲਤੀ (ਝੂਠੀ ਨਕਾਰਾਤਮਕ): ਮਨਸੂਖ ਪਰਿਕਲਪਨਾ ਨੂੰ ਰੱਦ ਕਰਨ ਵਿੱਚ ਅਸਫਲ ਰਹਿਣਾ ਜਦੋਂ ਇਹ ਗਲਤੀ ਹੈ (β ਗਲਤੀ)
ਉਦਾਹਰਨ: ਸਪੈਮ ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ:
- ਟਾਈਪ I: ਜਾਇਜ਼ ਈਮੇਲ ਨੂੰ ਸਪੈਮ ਵਜੋਂ ਨਿਸ਼ਾਨਬੱਧ ਕਰਨਾ
- ਟਾਈਪ II: ਗੁੰਮ ਸਪੈਮ ਈਮੇਲ (ਇਸ ਨੂੰ ਛੱਡਣਾ)
ਸ਼ਕਤੀ = 1 - β (ਝੂਠੀ ਮਨਸੂਖ ਪਰਿਕਲਪਨਾ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਰੱਦ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ)
2. ਪੀ-ਮੁੱਲ ਕੀ ਹੈ ਅਤੇ ਤੁਸੀਂ ਇਸ ਦੀ ਵਿਆਖਿਆ ਕਿਵੇਂ ਕਰਦੇ ਹੋ?
ਜਵਾਬ:
ਪੀ-ਵੈਲਯੂ ਵੇਖੇ ਗਏ ਡੇਟਾ ਦੇ ਰੂਪ ਵਿੱਚ ਅਤਿਅੰਤ (ਜਾਂ ਵਧੇਰੇ ਅਤਿਅੰਤ) ਡੇਟਾ ਨੂੰ ਵੇਖਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ, ਇਹ ਮੰਨਦੇ ਹੋਏ ਕਿ ਮਨਸੂਖ ਅਨੁਮਾਨ ਸੱਚ ਹੈ.
ਵਿਆਖਿਆ:
- ਪੀ 10 ਮਲਟੀਕੋਲੀਨੇਅਰਟੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ
- ਸਧਾਰਣਤਾ ਲਈ Q-Q ਪਲਾਟ
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪ੍ਰਸ਼ਨ
ਐਮਐਲ ਫੰਡਾਮੈਂਟਲਸ
1. ਪੱਖਪਾਤ-ਪਰਿਵਰਤਨ ਵਪਾਰ ਦੀ ਵਿਆਖਿਆ ਕਰੋ.
ਜਵਾਬ:
- ਪੱਖਪਾਤ: ਧਾਰਨਾਵਾਂ ਨੂੰ ਸਰਲ ਬਣਾਉਣ ਵਿੱਚ ਗਲਤੀ (ਅੰਡਰਫਿਟਿੰਗ)
- ਭਿੰਨਤਾ: ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਤੋਂ ਗਲਤੀ (ਓਵਰਫਿਟਿੰਗ)
- ਟ੍ਰੇਡਆਫ: ਘੱਟ ਪੱਖਪਾਤ ਵਾਲੇ ਮਾਡਲਾਂ ਵਿੱਚ ਉੱਚ ਭਿੰਨਤਾ ਹੁੰਦੀ ਹੈ, ਅਤੇ ਇਸਦੇ ਉਲਟ
ਉਦਾਹਰਣਾਂ:
- ਉੱਚ ਪੱਖਪਾਤ: ਗੈਰ-ਰੇਖਿਕ ਡੇਟਾ 'ਤੇ ਲੀਨੀਅਰ ਰਿਗ੍ਰੇਸ਼ਨ
- ਉੱਚ ਭਿੰਨਤਾ: ਓਵਰਫਿਟਿੰਗ ਫੈਸਲੇ ਦਾ ਰੁੱਖ
ਹੱਲ:
- ਦੋਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਕਰਾਸ-ਵੈਲੀਡੇਸ਼ਨ
- ਭਿੰਨਤਾ ਨੂੰ ਘਟਾਉਣ ਲਈ ਨਿਯਮਤ ਕਰਨ (ਐਲ 1 / ਐਲ 2)
- ਦੋਵਾਂ ਨੂੰ ਘਟਾਉਣ ਦੇ ਤਰੀਕੇ
2. ਕਰਾਸ-ਪ੍ਰਮਾਣਿਕਤਾ ਕੀ ਹੈ ਅਤੇ ਇਹ ਮਹੱਤਵਪੂਰਨ ਕਿਉਂ ਹੈ?
ਜਵਾਬ:
ਕਰਾਸ-ਪ੍ਰਮਾਣਿਕਤਾ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਅਤੇ ਓਵਰਫਿਟਿੰਗ ਨੂੰ ਰੋਕਣ ਲਈ ਕਈ ਵਾਰ ਸਿਖਲਾਈ ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਸੈੱਟਾਂ ਵਿੱਚ ਡੇਟਾ ਨੂੰ ਵੰਡਦੀ ਹੈ.
ਕਿਸਮਾਂ:
- k-fold CV: ਡਾਟਾ ਨੂੰ k ਫੋਲਡਾਂ ਵਿੱਚ ਵੰਡੋ, k-1 'ਤੇ ਟ੍ਰੇਨ ਕਰੋ, ਬਾਕੀ 'ਤੇ ਪ੍ਰਮਾਣਿਤ ਕਰੋ
- ਲੀਵ-ਵਨ-ਆਉਟ: k=n (ਹਰੇਕ ਨਮੂਨਾ ਇੱਕ ਵਾਰ ਪ੍ਰਮਾਣਿਕਤਾ ਸੈੱਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ)
- ਸਟ੍ਰੈਟੀਫਾਈਡ ਕੇ-ਫੋਲਡ: ਹਰੇਕ ਫੋਲਡ ਵਿੱਚ ਕਲਾਸ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਨੂੰ ਕਾਇਮ ਰੱਖਦਾ ਹੈ
ਮਹੱਤਤਾ:
- ਸਿੰਗਲ ਟ੍ਰੇਨ/ਟੈਸਟ ਸਪਲਿਟ ਨਾਲੋਂ ਵਧੇਰੇ ਭਰੋਸੇਮੰਦ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਅਨੁਮਾਨ
- ਓਵਰਫਿਟਿੰਗ ਦਾ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ
- ਸੀਮਤ ਡੇਟਾ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਵਰਤੋਂ ਕਰਦਾ ਹੈ
ਵਿਸ਼ੇਸ਼ ਐਲਗੋਰਿਦਮ
3. ਵਰਣਨ ਕਰੋ ਕਿ ਫੈਸਲਾ ਦਾ ਰੁੱਖ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ।
ਜਵਾਬ:
ਫੈਸਲੇ ਦੇ ਰੁੱਖ ਇਕੋ ਜਿਹੇ ਸਮੂਹ ਬਣਾਉਣ ਲਈ ਫੀਚਰ ਮੁੱਲਾਂ ਦੇ ਅਧਾਰ ਤੇ ਡੇਟਾ ਨੂੰ ਬਾਰ ਬਾਰ ਵੰਡਦੇ ਹਨ.
ਮੁੱਖ ਧਾਰਨਾਵਾਂ:
- ਰੂਟ ਨੋਡ: ਸਾਰੇ ਡੇਟਾ ਦੇ ਨਾਲ ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ
- ਅੰਦਰੂਨੀ ਨੋਡਜ਼: ਫੀਚਰ ਥ੍ਰੈਸ਼ਹੋਲਡ ਦੇ ਅਧਾਰ ਤੇ ਫੈਸਲੇ ਦੇ ਬਿੰਦੂ
- ਪੱਤਾ ਨੋਡਜ਼: ਅੰਤਮ ਭਵਿੱਖਬਾਣੀਆਂ (ਵਰਗੀਕਰਣ) ਜਾਂ ਮੁੱਲ (ਰਿਗਰੈਸ਼ਨ)
- ਵੰਡਣ ਦੇ ਮਾਪਦੰਡ: ਗਿਨੀ ਅਸ਼ੁੱਧਤਾ (ਵਰਗੀਕਰਣ), ਭਿੰਨਤਾ ਘਟਾਉਣ (ਰਿਗਰੈਸ਼ਨ)
ਫਾਇਦੇ: ਵਿਆਖਿਆਯੋਗ, ਮਿਸ਼ਰਤ ਡੇਟਾ ਕਿਸਮਾਂ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ, ਕੋਈ ਵਿਸ਼ੇਸ਼ਤਾ ਸਕੇਲਿੰਗ ਦੀ ਜ਼ਰੂਰਤ ਨਹੀਂ ਹੈ
ਨੁਕਸਾਨ: ਓਵਰਫਿਟਿੰਗ ਦਾ ਸ਼ਿਕਾਰ, ਛੋਟੇ ਡੇਟਾ ਤਬਦੀਲੀਆਂ ਦੇ ਨਾਲ ਅਸਥਿਰ
4. ਬੈਗਿੰਗ ਅਤੇ ਬੂਸਟਿੰਗ ਵਿੱਚ ਕੀ ਅੰਤਰ ਹੈ?
ਜਵਾਬ:
- ਬੈਗਿੰਗ (ਬੂਟਸਟ੍ਰੈਪ ਐਗਰੀਗੇਟਿੰਗ): ਬੇਤਰਤੀਬੇ ਡੇਟਾ ਸਬਸੈੱਟਾਂ 'ਤੇ ਮਲਟੀਪਲ ਮਾਡਲ ਬਣਾਉਂਦਾ ਹੈ, averageਸਤਨ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰਦਾ ਹੈ. ਭਿੰਨਤਾ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ, ਓਵਰਫਿਟਿੰਗ ਦਾ ਮੁਕਾਬਲਾ ਕਰਦਾ ਹੈ. ਉਦਾਹਰਣ: ਬੇਤਰਤੀਬੇ ਜੰਗਲ.
- ਬੂਸਟਿੰਗ: ਮਾਡਲਾਂ ਨੂੰ ਕ੍ਰਮਵਾਰ ਸਿਖਲਾਈ ਦਿੰਦਾ ਹੈ, ਹਰ ਇੱਕ ਪਿਛਲੀਆਂ ਗਲਤੀਆਂ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦਾ ਹੈ. ਪੱਖਪਾਤ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ, ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ. ਉਦਾਹਰਣ: ਅਡਾਬੂਸਟ, ਐਕਸਜੀਬੂਸਟ.
ਮੁੱਖ ਅੰਤਰ:
- ਬੈਗਿੰਗ: ਸਮਾਨਾਂਤਰ, ਪਰਿਵਰਤਨ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ
- ਪ੍ਰੋਤਸਾਹਨ: ਲੜੀਵਾਰ, ਪੱਖਪਾਤ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ
- ਬੈਗਿੰਗ: ਸੁਤੰਤਰ ਮਾਡਲ
- ਬੂਸਟਿੰਗ: ਨਿਰਭਰ ਮਾਡਲ ਗਲਤੀਆਂ ਤੋਂ ਸਿੱਖਦੇ ਹਨ
SQL ਪ੍ਰਸ਼ਨ
ਬੇਸਿਕ SQL
1. ਕਰਮਚਾਰੀ ਟੇਬਲ ਤੋਂ ਦੂਜੀ ਸਭ ਤੋਂ ਵੱਧ ਤਨਖਾਹ ਲੱਭੋ।
ਹੱਲ:
''' SQL
- ਵਿਧੀ 1: ਉਪ-ਪੁੱਛਗਿੱਛ
ਅਧਿਕਤਮ (ਤਨਖਾਹ) ਨੂੰ ਦੂਜੀ ਸਭ ਤੋਂ ਵੱਧ ਤਨਖਾਹ ਵਜੋਂ ਚੁਣੋ
ਕਰਮਚਾਰੀ ਤੋਂ
ਤਨਖਾਹ ਕਿੱਥੇ