Failed to render content. Please refresh the page. Showing plain-text fallback.
"@/components/CTA" இலிருந்து CTA ஐ இறக்குமதி செய்யவும்
தரவு அறிவியல் நேர்காணல் கேள்விகள்: DS பாத்திரங்களுக்கான முழுமையான வழிகாட்டி (2025)
கடைசியாக புதுப்பிக்கப்பட்டது: பிப்ரவரி 7, 2025
முக்கிய குறிப்புகள்
- தரவு அறிவியல் நேர்காணல்கள் புள்ளிவிவரங்கள், இயந்திர கற்றல், SQL மற்றும் வணிக புத்திசாலித்தனத்தை உள்ளடக்கியது
- கருத்துக்களை எளிமையாக விளக்குவது மற்றும் நிஜ உலக சிக்கல்களைத் தீர்ப்பது பயிற்சி
- மாஸ்டர் A / B சோதனை, சோதனை வடிவமைப்பு மற்றும் காரண அனுமானம்
- தொழில்நுட்ப திறன்கள் மற்றும் வணிக தாக்கம் இரண்டையும் நிரூபிக்கவும்
- வழக்கு ஆய்வுகள் மற்றும் தயாரிப்பு உணர்வு கேள்விகளுக்கு தயாராகுங்கள்
🎯 ப்ரோ உதவிக்குறிப்பு: தரவு அறிவியல் நேர்காணல்கள் தரவிலிருந்து நுண்ணறிவுகளைப் பிரித்தெடுக்கவும் வணிக முடிவுகளை இயக்கவும் உங்கள் திறனை மதிப்பிடுகின்றன. சிக்கலான கருத்துக்களை வெறுமனே விளக்குவதிலும், வணிக புத்திசாலித்தனத்தைக் காண்பிப்பதிலும், இறுதி முதல் இறுதி வரை சிக்கல் தீர்க்கும் திறன்களை நிரூபிப்பதிலும் கவனம் செலுத்துங்கள்.
தரவு அறிவியல் நேர்காணல் அமைப்பு
தரவு அறிவியல் நேர்காணல்கள் பொதுவாக வெவ்வேறு திறன்களை மதிப்பிடும் பல சுற்றுகளை உள்ளடக்குகின்றன:
நேர்காணல் சுற்றுகள்:
- தொலைபேசி திரை: அடிப்படை SQL, புள்ளிவிவரங்கள் மற்றும் நடத்தை கேள்விகள்
- தொழில்நுட்ப நேர்காணல்: குறியீட்டு, புள்ளிவிவரங்கள், ML வழிமுறைகள்
- வழக்கு ஆய்வு: வணிக சிக்கல் தீர்க்கும் மற்றும் விளக்கக்காட்சி
- குழு/தலைமைத்துவம்: கலாச்சார பொருத்தம் மற்றும் ஒத்துழைப்பு மதிப்பீடு
மதிப்பீட்டு பகுதிகள்:
- தொழில்நுட்ப திறன்கள்: SQL, பைதான் / ஆர், புள்ளிவிவரங்கள், இயந்திர கற்றல்
- சிக்கல் தீர்க்கும்: பகுப்பாய்வு சிந்தனை மற்றும் முறை
- வணிக புத்திசாலித்தனம்: வணிக தாக்கம் மற்றும் முன்னுரிமைகளைப் புரிந்துகொள்வது
- தொடர்பு: தொழில்நுட்பம் அல்லாத பங்குதாரர்களுக்கு தொழில்நுட்ப கருத்துக்களை விளக்குதல்
புள்ளிவிபரம் மற்றும் நிகழ்தகவு கேள்விகள்
அடிப்படை புள்ளிவிபரம்
1. வகை I மற்றும் வகை II பிழைகளுக்கு இடையிலான வேறுபாட்டை விளக்குக.
பதில்:
- வகை I பிழை (தவறான நேர்மறை): பூஜ்ய கருதுகோளை அது உண்மையாக இருக்கும்போது நிராகரித்தல் (α பிழை)
- வகை II பிழை (தவறான எதிர்மறை): பூஜ்ய கருதுகோளை அது தவறாக இருக்கும்போது நிராகரிக்கத் தவறியது (β பிழை)
உதாரணம்: ஸ்பேம் கண்டறிதலில்:
- வகை I: முறையான மின்னஞ்சலை ஸ்பேம் என குறிக்கிறது
- வகை II: காணாமல் போன ஸ்பேம் மின்னஞ்சல் (அதை அனுமதிக்கிறது)
சக்தி = 1 - β (தவறான பூஜ்ய கருதுகோளை சரியாக நிராகரிக்கும் நிகழ்தகவு)
2. p-மதிப்பு என்றால் என்ன, அதை எவ்வாறு விளக்குவது?
பதில்:
P-மதிப்பு என்பது கவனிக்கப்பட்ட தரவைப் போலவே தீவிரமான (அல்லது மிகவும் தீவிரமான) தரவைக் கவனிப்பதற்கான நிகழ்தகவு ஆகும், பூஜ்ய கருதுகோள் உண்மை என்று கருதுகிறது.
உரை:
- p 10 மல்டிகோலினியரிட்டியைக் குறிக்கிறது
- இயல்பான நிலைக்கான Q-Q அடுக்குகள்
இயந்திர கற்றல் கேள்விகள்
எம்.எல் அடிப்படைகள்
1. சார்பு-மாறுபாடு பரிமாற்றத்தை விளக்கவும்.
பதில்:
- சார்பு: அனுமானங்களை எளிதாக்குவதில் பிழை (அண்டர்ஃபிட்டிங்)
- மாறுபாடு: பயிற்சி தரவுக்கு உணர்திறனில் இருந்து பிழை (அதிகப்படியான பொருத்துதல்)
- Tradeoff: குறைந்த சார்பு கொண்ட மாதிரிகள் அதிக மாறுபாட்டைக் கொண்டுள்ளன, நேர்மாறாகவும்
எடுத்துக்காட்டுகள்:
- உயர் சார்பு: நேரியல் அல்லாத தரவில் நேரியல் பின்னடைவு
- உயர் மாறுபாடு: அதிகப்படியான முடிவு மரம்
தீர்வுகள்:
- இரண்டையும் மதிப்பிடுவதற்கான குறுக்கு சரிபார்ப்பு
- மாறுபாட்டைக் குறைக்க முறைப்படுத்தல் (L1 / L2)
- இரண்டையும் குறைக்க கூட்டு முறைகள்
2. குறுக்கு-சரிபார்ப்பு என்றால் என்ன, அது ஏன் முக்கியமானது?
பதில்:
குறுக்கு-சரிபார்ப்பு தரவை பயிற்சி மற்றும் சரிபார்ப்பு தொகுப்புகளில் பிரிக்கிறது மாதிரி செயல்திறனை மதிப்பிடுவதற்கும் அதிகப்படியான பொருத்தத்தைத் தடுப்பதற்கும்.
வகைகள்:
- k-மடிப்பு CV: தரவை k மடிப்புகளாகப் பிரிக்கவும், k-1 இல் பயிற்சி செய்யவும், மீதமுள்ளவற்றை சரிபார்க்கவும்
- லீவ்-ஒன்-அவுட்: கே = என் (ஒவ்வொரு மாதிரி ஒரு முறை சரிபார்ப்பு அமைக்கப்பட்டுள்ளது)
- அடுக்கு k-மடிப்பு: ஒவ்வொரு மடிப்பிலும் வகுப்பு விநியோகத்தை பராமரிக்கிறது
முக்கியத்துவம்:
- ஒற்றை ரயில்/சோதனை பிளவை விட நம்பகமான செயல்திறன் மதிப்பீடு
- அதிகமாக பொருத்துவதைக் கண்டறிய உதவுகிறது
- வரையறுக்கப்பட்ட தரவின் பயன்பாட்டை அதிகரிக்கிறது
குறிப்பிட்ட வழிமுறைகள்
3. ஒரு முடிவு மரம் எவ்வாறு செயல்படுகிறது என்பதை விளக்குங்கள்.
பதில்:
முடிவு மரங்கள் ஒரே மாதிரியான குழுக்களை உருவாக்க அம்ச மதிப்புகளின் அடிப்படையில் தரவை மீண்டும் மீண்டும் பிரிக்கின்றன.
முக்கிய கருத்துகள்:
- ரூட் முனை: அனைத்து தரவுடனும் தொடக்க புள்ளி
- உள் முனைகள்: அம்ச வரம்புகளை அடிப்படையாகக் கொண்ட முடிவு புள்ளிகள்
- இலை முனைகள்: இறுதி கணிப்புகள் (வகைப்பாடு) அல்லது மதிப்புகள் (பின்னடைவு)
- பிரித்தல் அளவுகோல்கள்: கினி அசுத்தம் (வகைப்பாடு), மாறுபாடு குறைப்பு (பின்னடைவு)
நன்மைகள்: விளக்கக்கூடியது, கலப்பு தரவு வகைகளைக் கையாளுகிறது, அம்ச அளவிடல் தேவையில்லை
தீமைகள்: சிறிய தரவு மாற்றங்களுடன் அதிகப்படியான பொருத்தத்திற்கு ஆளாகக்கூடியது, நிலையற்றது
4. பேக்கிங் மற்றும் பூஸ்டிங் இடையே உள்ள வேறுபாடு என்ன?
பதில்:
- பேக்கிங் (பூட்ஸ்ட்ராப் ஒருங்கிணைத்தல்): சீரற்ற தரவு துணைக்குழுக்களில் பல மாதிரிகளை உருவாக்குகிறது, சராசரி கணிப்புகள். மாறுபாட்டைக் குறைக்கிறது, அதிகப்படியான பொருத்தத்தை எதிர்த்துப் போராடுகிறது. எடுத்துக்காட்டு: ரேண்டம் காடு.
- பூஸ்டிங்: தொடர்ச்சியாக மாதிரிகளை ரயில்கள் செய்கின்றன, ஒவ்வொன்றும் முந்தைய தவறுகளில் கவனம் செலுத்துகின்றன. சார்பைக் குறைக்கிறது, துல்லியத்தை மேம்படுத்துகிறது. எடுத்துக்காட்டு: AdaBoost, XGBoost.
முக்கிய வேறுபாடுகள்:
- பேக்கிங்: இணையாக, மாறுபாட்டைக் குறைக்கிறது
- ஊக்கம்: தொடர்ச்சியான, சார்பைக் குறைக்கிறது
- பேக்கிங்: சுயாதீன மாதிரிகள்
- ஊக்கம்: பிழைகளிலிருந்து கற்றுக்கொள்ளும் சார்பு மாதிரிகள்
SQL கேள்விகள்
அடிப்படை SQL
1. பணியாளர் அட்டவணையில் இருந்து இரண்டாவது அதிக சம்பளத்தைக் கண்டறியவும்.
தீர்வுகள்:
'''SQL
- முறை 1: துணை வினவல்
MAX(சம்பளம்) இரண்டாவதுமிக உயர்ந்த சம்பளமாக தேர்ந்தெடுக்கவும்
பணியாளரிடமிருந்து
சம்பளம் எங்கே