Deep Seek - ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഇന്നൊവേഷൻ! പുറത്തിറങ്ങി ഒരാഴ്ച കൊണ്ട് അമേരിക്കൻ ടെക്ക് ഭീമന്മാരുടെയൊക്കെ ഓഹരി വിലയ്ക്ക് ഇളക്കം തട്ടിച്ച കുഞ്ഞൻ ചൈനീസ് കമ്പനിയും അവരുടെ കഥകളും വാർത്തകളിൽ നിറയുകയാണ്.
കഴിഞ്ഞയാഴ്ച അവർ റിലീസ് ചെയ്ത Deep Seek R1 എന്ന ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ടൂൾ ആണ് താരം. ഈ മേഖലയിലെ വമ്പന്മാരായ ചാറ്റ് ജിപിടി, ഗൂഗിൾ ജെമിനൈ , മെറ്റാ, മറ്റനേകം പ്രൊഡക്ടുകൾ എന്നിവയ്ക്കൊക്കെ Deep Seek R1 വെല്ലുവിളി ഉയർത്തികഴിഞ്ഞു. എല്ലാ ടെക് ഓഹരികളിലും ചാഞ്ചാട്ടം ഉണ്ടായെങ്കിലും ഏറ്റവും വലിയ ഇടിവുണ്ടായത് NVIDIA എന്ന ഹാർഡ് വെയർ ചിപ്പ് നിർമ്മാണ കമ്പനിക്ക് ആയിരുന്നു. കഴിഞ്ഞ അഞ്ച് ദിവസങ്ങൾക്കിടെ അവരുടെ ഓഹരി 15% ഇടിഞ്ഞു.
അമേരിക്കയ്ക്ക് പുറത്ത് നിന്ന് ടെക് ലോകത്ത് ആദ്യമായി ഇത്ര വലിയ ചലനം ഉണ്ടാക്കിയ Deep Seek എന്താണ് ചെയ്തത് എന്ന് അന്വേഷിക്കുന്നതിന് മുൻപ് കുറച്ച് സംഗതികൾ മനസ്സിലാക്കേണ്ടതുണ്ട്. നിലവിലുള്ള മുൻനിര ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡലുകളെ ട്രെയിൻ ചെയ്യാൻ വമ്പൻ കംപ്യൂട്ടിംഗ് ശേഷിയും അതൊക്കെ പ്രവർത്തിപ്പിക്കാൻ വൻതോതിൽ ഊർജ്ജവും ഉപയോഗിക്കുന്നുണ്ട്. ഉദാഹരണത്തിന് ഓപ്പൺ എഐ യുടെ ജിപിടി -4 മോഡലിനെ ട്രെയിൻ ചെയ്യാൻ എസ്റ്റിമേറ്റ് ചെയ്ത തുക ഏകദേശം 100 മില്യൺ ഡോളർ (850 കോടി രൂപ) ആയിരുന്നു. ഇതെല്ലാം ചെലവാക്കിയത് കംപ്യൂട്ടിംഗ് ശേഷിക്ക് ആവശ്യമായ CPU, GPU എന്നിവയ്ക്കും ഡാറ്റാ സെന്ററിലേക്ക് വേണ്ട ഊർജ്ജാവശ്യങ്ങൾക്കും വേണ്ടി മാത്രമായിരുന്നു. പ്രോഡക്ട് റിസർച്ച്, എഞ്ചിനീയറിംഗ് ചെലവുകൾ ഇതിന് പുറമെയാണ്.
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന് ആവശ്യമുള്ള കംപ്യൂട്ടിംഗ് ശേഷിക്ക് വേണ്ടി എല്ലാവരും ഇപ്പോൾ ആശ്രയിക്കുന്നത് NVIDIA യെ ആണ്. അവരുടെ പുതുതലമുറ ജി പി യു കൾ ആണ് ഒട്ടു മിക്ക എ ഐ മോഡലുകളെയും പ്രവർത്തിപ്പിക്കുന്നത്. ഏകദേശം 35 ലക്ഷത്തോളം രൂപ ഒരെണ്ണത്തിന് വിലയുള്ള പതിനായിരക്കണക്കിന് NVIDIA H100 GPU കൾ ആണ് മുൻനിരക്കാരൊക്കെ എ ഐ ട്രെയിനിങ്ങിനും മോഡലുകളെ പ്രവർത്തിപ്പിക്കാനുമായി ഒരേ സമയം ഉപയോഗിക്കുന്നത്. ഈ മേഖലയിലെ കുത്തക ആയി മാറിയതോടെയാണ് വിപണിമൂല്യത്തിൽ ലോകത്തെ മുൻനിരയിലേക്ക് NVIDIA അടുത്ത കാലത്ത് എത്തിയത്. ഇത്തരം ഭീമമായ തുക ആവശ്യമുള്ളത് കൊണ്ട് മൾട്ടി മില്ല്യൻ ഡോളർ വിപണി മൂല്യമുള്ള കമ്പനികൾക്ക് പോലും ഒരു പക്ഷേ അപ്രാപ്യമായ രീതിയിൽ ആയിരുന്നു എ ഐ ഡെവലപ്പ്മെന്റിന്റെ പോക്ക്.
അവിടെയാണ് ഈ മേഖലയിൽ ഇത് വരെ കേട്ടിട്ടില്ലാത്ത Deep Seek, അഞ്ചര മില്ല്യൻ ഡോളർ (അൻപത് കോടി രൂപ) ചെലവിൽ വമ്പൻമാരോട് കിടപിടിക്കുന്നതോ അതിനേക്കാൾ മികച്ചതോ ആയ എ ഐ മോഡലുമായി കടന്നുവന്ന് അത്ഭുതം സൃഷ്ടിച്ചത്. പല മേഖലയിലും ജിപിടി -4 നേക്കാളും മികച്ച റിസൾട്ട് Deep Seek തരുന്നുണ്ട് എന്ന് എ ഐ മോഡലുകളെ ബെഞ്ച്മാർക്ക് ചെയ്യുന്ന പല പരീക്ഷണങ്ങൾ വഴി ഇതിനകം തന്നെ തെളിഞ്ഞു കഴിഞ്ഞു.
Deep Seek അവരുടെ പ്രോഡക്ട് അവതരിപ്പിക്കുക മാത്രമല്ല ചെയ്തത്. അതിന്റെ സോഴ്സ് കോഡും, എങ്ങിനെ ഇത് സാധിച്ചു എന്ന വിശദമായ ടെക്നിക്കൽ റിപ്പോർട്ടും പബ്ലിഷ് ചെയ്തു. ഓപ്പൺ സോഴ്സ് ആയിട്ട് കോഡ് ലഭ്യമാക്കിയിട്ടുള്ളത് കൊണ്ട് അതുപയോഗിച്ച് മറ്റുള്ളവർക്ക് പുതിയ പ്രൊഡക്ടുകൾ നിർമ്മിക്കാനും കോഡ് മെച്ചപ്പെടുത്തി ഇതിനേക്കാൾ മികച്ച എ ഐ മോഡലുകൾ നിർമ്മിക്കാനും കഴിയും. ഓപ്പൺ സോഴ്സിൽ വൻകിട മോഡലുകൾ പലതും ഇപ്പോൾ തന്നെ ലഭ്യമാണെങ്കിലും പ്രവർത്തിപ്പിക്കാൻ വൻകിട മൂലധന നിക്ഷേപം വേണ്ടത് കൊണ്ട് മാത്രം മാറി നിന്ന പലർക്കും എ ഐയുടെ കോർ ഡെവലപ്പ്മെന്റിലേക്ക് തിരിച്ച് പ്രവേശിക്കാൻ ഇത് വഴി തുറന്നു.
"മികച്ച എ ഐ ക്ക് കൂടുതൽ എണ്ണം കരുത്തുറ്റ GPU കൾ" എന്നതായിരുന്നു ഈ മേഖലയിലെ പൊതുവായ വിജയമന്ത്രം. ലളിതമായി പറഞ്ഞാൽ Deep Seek അത് മാറ്റി മറിച്ചു. പുറത്ത് ലഭ്യമായ കണക്കുകൾ ശരിയാണെങ്കിൽ ഒരു ലക്ഷത്തോളം ഏറ്റവും ആധുനിക GPU കൾ ഉപയോഗിച്ച് ഓപ്പൺ എ ഐ ജിപിടി -4 നെ ട്രെയിൻ ചെയ്തതെങ്കിൽ അത്ര നൂതനമൊന്നുമല്ലാത്ത ആയിരത്തോളം GPU കൾ ഉപയോഗിച്ചാണ് Deep Seek അതേ കാര്യം സാധ്യമാക്കിയത്. നൂറിൽ ഒന്ന് കംപ്യൂട്ടിംഗ് ശേഷി ഉപയോഗിച്ച്!
ഏറ്റവും നൂതനമായ കംപ്യൂട്ടിംഗ് ചിപ്പുകളും അറിവും ചൈനക്ക് ലഭിക്കുന്നതിൽ അമേരിക്കയുടെ നിരോധനം നിലനിൽക്കുന്ന സമയത്ത് ഇതെങ്ങിനെ സാധിച്ചു എന്ന് എല്ലാവരും മൂക്കത്ത് വിരൽ വെയ്ക്കുന്നുണ്ട്. പലവിധ സിദ്ധാന്തങ്ങളും അഭിപ്രായങ്ങളും ഇതേ കുറിച്ച് വരുന്നുണ്ടെങ്കിലും വിശ്വസനീയമായി തോന്നിയത് "ആവശ്യം സൃഷ്ടിയുടെ മാതാവാകും" എന്നാരോ ഇതേ കുറിച്ച് കമന്റ് ചെയ്തതാണ്. അതേ, ചൈനയുടെ മേലെയുള്ള ഉപരോധങ്ങൾ തന്നെയാണ് ഇപ്പോൾ ലോകത്തെ മുഴുവൻ ജനതയ്ക്കും ഭാവിയിൽ പ്രയോജനം ചെയ്തേക്കാവുന്ന ഒന്നിലേക്ക് ഇത്ര വേഗം എത്തിച്ചത്. അല്ലെങ്കിൽ ഒരു പക്ഷേ ഭീമൻ കമ്പനികളുടെ കുത്തക ആയി മാറിയേക്കാമായിരുന്ന ഒന്നിനെ മാറ്റിമറിച്ചത്.
എങ്ങിനെ ഇത് സാധിച്ചു? ഹാർഡ് വെയർ റിസോഴ്സുകളുടെ ഉപയോഗം പരമാവധി കുറയ്ക്കുന്ന രീതിയിൽ അവർ നടത്തിയ സോഫ്റ്റ് വെയർ തലത്തിലുള്ള ഒപ്റ്റിമൈസേഷൻ ആണ് ഇതിൽ ഏറ്റവും പ്രധാനം. ഉദാഹരണത്തിന് എല്ലാ മോഡലുകളിലും ദശാംശസംഖ്യകളുടെ കൃത്യതയ്ക്ക് വേണ്ടി 32 ബിറ്റുകൾ ഉപയോഗിക്കുമ്പോൾ Deep Seek അത് 8 ബിറ്റുകൾ ആയി കുറച്ചു. അത് വഴി ഒറ്റയടിക്ക് 75% മെമ്മറി ഉപയോഗം കുറക്കാൻ അവർക്ക് കഴിഞ്ഞു.
ജിപിടി -4 ഉൾപ്പടെയുള്ള മുൻനിര മോഡലുകൾ എല്ലാം മാസീവ് മോഡലുകൾ ആണ്. ജിപിടി -4 ൽ ഏകദേശം 1.8 ട്രില്യൻ പരാമീറ്ററുകൾ ആക്ടീവ് ആയി നിന്നിട്ടാണ് നമ്മുടെ ചോദ്യങ്ങൾക്ക് ഉത്തരം അത് തരുന്നത്. ഇത്തരം ലാർജ്ജ് ലാംഗ്വേജ് മോഡലുകൾ പ്രവർത്തിക്കാൻ ആവശ്യമായ പരാമീറ്ററുകളുടെ എണ്ണവും Deep Seek ഓപ്റ്റിമൈസ് ചെയ്തു ആകെ 671 ബില്ല്യൻ ആക്കി ചുരുക്കി. ജി പി ടി 4 നു ആവശ്യമുള്ളവയുടെ മുന്നിൽ ഒന്ന് മാത്രം. ഇതിൽ തന്നെ ഒരേ സമയം ആക്ടീവ് ആകുന്നത് 37 ബില്ല്യൻ എണ്ണവും.
Deep Seek സത്യത്തിൽ ഒട്ടനവധി എക്സ്പേർട്ട് സിസ്റ്റങ്ങളുടെ ഒരു കളക്ഷൻ ആണെന്ന് പറയാം. അതായത് അതിനോടുള്ള ചോദ്യത്തിന്റെ കോൺടെക്സ്റ്റ് മനസ്സിലാക്കി ആവശ്യമുള്ള എക്സ്പേർട്ട് സിസ്റ്റം മാത്രമാണ് ആക്ടീവ് ആകുക. ഉദാഹരണത്തിന് മെഡിക്കൽ ചോദ്യമാണെങ്കിൽ അതുമായി ബന്ധപ്പെട്ട എക്സ്പേർട്ട് സിസ്റ്റവും ലീഗൽ ചോദ്യം ആണെങ്കിൽ അതുമായി ബന്ധപ്പെട്ട സിസ്റ്റവും ആയിരിക്കും ആക്ടീവ് ആകുക. ഇങ്ങനെ പലവിധ മാറ്റങ്ങൾ വരുത്തിയാണ് GPU ഉപയോഗം ചിന്തിക്കാനാവാത്ത വിധം കുറച്ചത്.
DeepSeek ഒരു സാധാരണ ഗെയിമിംഗ് കമ്പ്യൂട്ടറിൽ പോലും നിങ്ങൾക്ക് ലോഡ് ചെയ്യിച്ചു ട്രെയിനിങ് നടത്താനും പ്രവർത്തിപ്പിക്കാനും കഴിയും എന്നതാണ് ഇതിലെ ഏറ്റവും പ്രധാന സംഗതി. NVIDIA യുടേതായി പുറത്തിറങ്ങിയതും ഭാവിയിലേക്ക് അനൗൺസ് ചെയ്തിട്ടൂള്ളതുമായ സൂപ്പർ ചിപ്പുകൾ ഉപയോഗിക്കാതെ തന്നെ എ ഐ ഗവേഷണവും ഡെവലപ്പ്മെന്റും ഉപയോഗവും സാധ്യമാകും.
എ ഐ ഇപ്പോൾ ക്ലൗഡിൽ നിന്നും SAAS ആയി ഉപയോഗിക്കുന്നവർക്ക് ഓപ്പൺ എ ഐ യിൽ ഒരു മില്ല്യൻ ടോക്കണുകൾക്ക് 4.4 ഡോളർ (400 രൂപ) ചെലവുണ്ടെങ്കിൽ Deep Seek ഒരു മില്ല്യൻ ടോക്കണുകൾ ഓഫർ ചെയ്യുന്നത് വെറും 10 സെന്റിന് (8 രൂപ) ആണെന്നതും കൂടി ചേർത്ത് വായിക്കുമ്പോഴാണ് ഈ കുഞ്ഞൻ ചൈനീസ് കമ്പനി കൊണ്ട് വരുന്ന ഡിസ്റപ്ഷന്റെ ആഴവും പരപ്പും മനസ്സിലാകൂ.
Deep Seek ടെക്നിക്കൽ റിപ്പോർട്ട് കമന്റിൽ വായിക്കാം.
ഡീപ്സീക് ഇറങ്ങിയതുമായി ബന്ധപ്പെട്ട് നിരവധി ചർച്ചകൾ നടക്കുകയാണല്ലോ? ഇത് ചൈനയുടെ ഒരു പൊളിറ്റിക്കൽ വെപ്പൺ ആണ്, ഡാറ്റ ചോർത്തും, വിശ്വസിക്കാമോ, മാൽവെയറുകൾ ഉണ്ടാകും ഇങ്ങിനെ നിരവധി ആശങ്കകൾ കൂടാതെ, ചൈനയെ സംബന്ധിച്ച കാര്യങ്ങൾ ചർച്ച ചെയ്യുന്നില്ല, ഇങ്ങിനെ പോകുന്നു ആവലാതികൾ. സാഹചര്യവശാൽ ഇതിനെപ്പറ്റി കുറെ എഴുതിയത് വച്ച് ചില കാര്യങ്ങൾ പങ്ക് വയ്ക്കാം.
ആശങ്ക 1. ഡീപ്സീക് ചാറ്റ്ജിപിറ്റിയുടെ കോപ്പി ആണ്.
ഈ പറയുന്നവയെല്ലാം ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ ആണ്, നിലവിൽ അവ ആരുടെയും കുത്തക അല്ല. ഇവയെല്ലാം ഗൂഗിൾ ലാബിൽ നിന്ന് 2017ൽ വന്ന ഒരു പേപ്പറിൽ പറയുന്ന ട്രാൻസ്ഫോർമർ മോഡലിനെ അടിസ്ഥാനമാക്കി നിർമ്മിക്കപ്പെട്ടവയാണ്. സ്വാഭാവികമായും ഇതിൽ മുന്നേറ്റം ഉണ്ടാവേണ്ടത് ഗൂഗിളിന് ആണെങ്കിലും അവർക്ക് DeepMind പോലെയുള്ള മികച്ച എഐ സങ്കേതങ്ങൾ ഉണ്ടെങ്കിലും ജനറേറ്റീവ് എഐ മോഡൽ ഉപയോഗിച്ച് മികച്ച ബ്രേക്ക്ത്രൂ ഉണ്ടാക്കിയത് OpenAI എന്ന കുഞ്ഞൻ കമ്പനിയാണ്. ഗൂഗിളിനെ ഞെട്ടിച്ച ഇവർ മുന്നേറ്റം തുടർന്നു. ഇവരുടെ മോഡലിനും ഇതേ പോലെ മോഡലുകൾ ഉണ്ടാക്കിയ ഗൂഗിൾ, ആന്ത്രോപിക് എന്നിവർക്കൊക്കെ ലോകത്തുള്ള വിജ്ഞാനം മുഴുവൻ ടോക്കണുകൾ ആക്കി ട്രെയിൻ ചെയ്തു ഇറക്കാൻ വേണ്ടി വന്നത് ഭീമമായ hardware കപ്പാസിറ്റി ആണ്. ഫലത്തിൽ അതിന് വേണ്ട GPU ചിപ്പുകൾ ഉണ്ടാക്കുന്ന NVIDIA എന്ന കമ്പനിയുടെ ഷെയർ അടിച്ച് കയറി. അവർ ഡിസൈൻ ചെയ്യുന്ന ചിപ്പുകൾ ഉണ്ടാക്കുന്ന Taiwan കമ്പനിയായ TSMCക്ക് വരുമാനവും കൂടി. എന്നാൽ ഡീപ്സീക് അതേ മോഡൽ കുറഞ്ഞ ചെലവിലും hardware റിസോഴ്സിലും ഉണ്ടാക്കി കാണിച്ചപ്പോഴാണ് ഇപ്പോൾ നടക്കുന്ന പുകിൽ എല്ലാം ഉണ്ടായത്. ഡീപ്സീക് കുറച്ച് സ്മാർട്ട് ടെക്നിക്കുകൾ ഉപയോഗിച്ചതിനാൽ ആണ് അവരുടെ മോഡൽ കുറഞ്ഞ ചെലവിൽ മികച്ച ഫലം തന്നത്. അത് ഉണ്ടാകാൻ കാരണം ആ ടീമിൽ ഉള്ളവർക്ക് ഇതിന്റെ മാത്ത്, സ്റ്റാറ്റ്, കമ്പ്യൂട്ടർ എഞ്ചിനീയറിംഗ്, ഹാർഡ്വെയർ ഒക്കെ സംബന്ധിച്ച മികച്ച ധാരണ ഉള്ളത് കൊണ്ടാണ്. ജിപിടി മോഡൽ കോപ്പി അടിച്ചെന്ന് സാം ആൾട്ട്മാൻ പോലും ആരോപിച്ചിട്ടില്ല. ഇനി ഇവർ മാത്രമല്ല മൂൺഷോട്ട് എന്നൊരു കമ്പനിയും കിമി എന്ന മികച്ച മോഡലുമായി വന്നിട്ടുണ്ട്.
ആശങ്ക 2. ധാരാളം ചോദ്യങ്ങൾക്ക് ഈ ഡീപ്സീക് മോഡലിന് ഉത്തരമില്ല.
ഇവിടെ മനസ്സിലാക്കേണ്ടത് അവരുടെ ഏറ്റവും പുതിയ മോഡൽ ആയ DeepSeel V3 അവർ ടെസ്റ്റ് ചെയ്തു പുറത്തിറക്കിയതിനൊപ്പം അതിന്റെ മൊത്തം സോഴ്സ് കോഡ് കൂടി ഗിറ്റ്ഹബ്ബിലൂടെയും മറ്റും പുറത്ത് വിട്ടിട്ടുണ്ട്. ഇത് മറ്റാരും മുന്നേ ചെയ്യാത്ത കാര്യമാണ്. അത് നമുക്ക് ഡൗൺലോഡ് ചെയ്ത് നമ്മുടെ മൊബൈൽ ഫോൺ, പിസി, ലാപ്ടോപ്, സെർവർ തുടങ്ങി എന്തിലും ഇട്ട് ഒടിക്കാം. ഇൻസ്റ്റാൾ ചെയ്തു കഴിഞ്ഞാൽ ഇന്റർനെറ്റ് കണക്ഷൻ ഒന്നും വേണ്ട, നമുക്ക് വേണ്ട സ്കെയിലിൽ ഉള്ള ആവശ്യങ്ങൾക്ക് ഉപയോഗിക്കാം. ഈ മോഡൽ ന്യൂറൽ നെറ്റ്വർക്കിൽ ട്രെയിൻ ചെയ്ത ഇത് വരെയുള്ളതിൽ ഏറ്റവും മികച്ചതാണ് എന്ന് ടെക് ലോകം തിരിച്ചറിഞ്ഞ് കഴിഞ്ഞു. എത്തിക്കൽ അല്ലാത്ത ചോദ്യങ്ങൾ ഇത് ബ്ലോക്ക് ചെയ്യുന്ന പോലെ പൊളിറ്റിക്കൽ ചോദ്യങ്ങളുടെയും ഉത്തരങ്ങൾ സപ്രസ് ചെയ്യും. എന്നാൽ അത് നമ്മുടെ ലോക്കൽ ഡിപ്ലോയ്മെന്റിൽ നമുക്ക് അത് പരിഹരിക്കാം. പക്ഷേ അതിന് പണച്ചെലവ് ഉണ്ടാകും - ഹാർഡ്വെയർ, മാൻപവർ ഒക്കെ വേണ്ടി വരും. അത് പറ്റാത്തവർക് വലിയ മോഡലിന്റെ ഡിസ്റ്റിൽ ചെയ്ത ചെറിയ മോഡൽ ഫോണിലും ലാപ്ടോപ്പിലുമൊക്കെ ഇൻസ്റ്റാൾ ചെയ്യാം. ഡിസ്റ്റിൽ ചെയ്തത് ഒരു കുട്ടിയും, മറ്റേത് ഒരു മാഷും ഉപയോഗിക്കുന്നത് എന്ന് കരുതിയാൽ മതി. നിലവിലെ എഐ കുത്തകകൾ നമുക്ക് മോഡൽ തരണമെങ്കിൽ APIക്ക് കാശ് കൊടുക്കണമായിരുന്നു ഡീപ്സീക് തൽക്കാലം കൊമേഴ്സ്യൽ പ്ലാൻ ഇല്ലാത്തതിനാൽ ചെറിയ ചാർജ് മാത്രമേ APIക്ക് ഈടാക്കുന്നുള്ളൂ എന്ന് തോന്നുന്നു. സോഴ്സ് കോഡ് മൊത്തം സൗജന്യമായി ഡൗൺലോഡ് ചെയ്യാനും അനുവദിക്കും. അതിനാലാണ് OpenAI ക്ലോസ്ഡ് ആണ് എന്ന മീമുകൾ ഇറങ്ങിയത്.
ആശങ്ക 3. ഇത് എന്റെ ഡാറ്റ മുഴുവൻ ചൈനയിലേക്ക് കൊണ്ട് പോകും.
ഇവർ മാത്രമല്ല, ഓൺലൈൻ മോഡിൽ ഇടുന്ന ഏത് എഐ മോഡലും നിങ്ങളുടെ ഡാറ്റ അവരുടെ സെർവറിൽ ശേഖരിക്കുകയും, അവരുടെ ഭാവി ട്രെയിനിംഗിന് ഉപയോഗിക്കുകയും ചെയ്യും. അത് വേണ്ട എന്നുണ്ടെങ്കിൽ നമുക്ക് ലോക്കൽ ആയി റൺ ചെയ്യണം. ഒന്നുകിൽ ഗൂഗിൾ, ഓപ്പൺഎഐ, ആന്ത്രോപിക്, മെറ്റാ, ടെസ്ല എന്നിവർക്ക് പണം കൊടുത്തു നമുക്ക് LLM ആപ്ലിക്കേഷനുകൾ റൺ ചെയ്യാം. ആർക്കായാലും ഡേറ്റ സെക്യൂരിറ്റി, പ്രൈവസി എന്നിവ ഉറപ്പാക്കേണ്ടത് നമ്മുടെ കൂടി ആവശ്യമാണ്. അപ്പോൾ ആപ്പ് വേറെ, മോഡൽ വേറെ എന്നതാണ് കാര്യം. അവർ രഹസ്യമാക്കി വച്ചെന്ന് ലോകം കരുതുന്നത് ട്രെയിനിങ് എങ്ങിനെ നടത്തി എന്നത് മാത്രമാണ്. എന്നാൽ ഓപ്പൻസോഴ്സ് കോഡ് പുറത്ത് വിട്ടതിനാൽ ഇത് ആർക്കും പരീക്ഷിച്ച് തട്ടിപ്പാണോ എന്ന് പരിശോധിക്കാമല്ലോ. മാത്രമല്ല DALL-E എന്ന സോഫ്റ്റ്വെയർ മോഡൽ പോലെ ചിത്രങ്ങൾ ഉണ്ടാക്കുന്ന ജാനസ് പ്രോ എന്നത് അവർ ആപ്പില്ലാതെ നേരെ സോഴ്സ് കോഡും, അതിന്റെ റിസർച്ച് പേപ്പറും സഹിതം പുറത്ത് വിട്ടിട്ടുണ്ട്.അത് ആർക്ക് വേണമെങ്കിലും ലോക്കൽ ആയി ഉപയോഗിക്കാം.
ആശങ്ക 4. ഇത് ചൈനീസ് സർക്കാരിന്റെ തന്ത്രമാണ്.
ഇത് പുറത്തിറക്കിയ കമ്പനി ഫിനാനിഷ്യൽ മാർക്കറ്റിൽ പണമുണ്ടാക്കിയ ചെറുപ്പക്കാരുടെ സംരംഭം ആണ്. കഴിഞ്ഞ വർഷം പകുതിക്ക് അവർ ചൈനയിലെ എഐ ഭീമന്മാരുടെ ഷെയർ വാല്യൂ എല്ലാം ഇടിച്ചിട്ടാണ് പുതിയ മോഡൽ ഇറക്കി ലോകമങ്ങും റിലീസ് ചെയ്തത്. ചൈനയിൽ എല്ലാ കമ്പനികളും കിട്ടുന്ന സംരക്ഷണം ഇവർക്കും ഉണ്ടാകും. എന്നാൽ, ഇവർ എല്ലാ രാജ്യങ്ങളിലേയും ലിഗൽ ഫ്രെയിംവർക്കുകൾ പാലിച്ചാൽ മാത്രമേ അതത് രാജ്യങ്ങളിൽ ആപ്പ് സ്റ്റോറിൽ ഇറക്കാൻ പറ്റൂ. അവരുടെ ആപ്പ് ഇൻസ്റ്റാൾ ചെയ്യണം എന്ന് ഒരു നിർബന്ധവുമില്ല. മുകളിൽ പറഞ്ഞത് പോലെ നമുക്ക് നമ്മുടെ സ്വന്തമാക്കി ഇത് റൺ ചെയ്യാൻ പറ്റും. ചൈന ആയാലും അമേരിക്ക ആയാലും അവരുടെ രാജ്യത്തേക്ക് ഫോറിൻ എക്സ്ചേഞ്ച് കൊണ്ട് വരുന്നത് പ്രമോട്ട് ചെയ്യും, നമുക്ക് വേണ്ടെങ്കിൽ ഉപയോഗിക്കണ്ട കാര്യമില്ല. ധാരാളം ഡാറ്റ പ്രൊട്ടക്ഷൻ റൂളുകൾ ഉള്ള യൂറോപ്പിൽ നിന്നും ഒരു മോഡലും വരുന്നില്ല എന്നതും കാണണം. പൊളിറ്റിക്കലി സെൻസിറ്റീവ് ആയ ഡാറ്റ കൊടുത്തോ ഇല്ലയോ എന്നതല്ല, അതിന്റെ മാത്തമറ്റിക്കൽ റീസണിങ് കഴിവാണ് മികച്ച് നിൽക്കുന്നത്. സദ്ധാരണക്കാർ അതിനാൽ ഡീപ്സീക് ഉപയോഗിക്കാൻ താൽപര്യമില്ലെങ്കിൽ ക്ലോഡ് അല്ലെങ്കിൽ ചാറ്റ്ജിപിറ്റി അല്ലെങ്കിൽ ജെമിനി, അതുമല്ലെങ്കിൽ ഇവയുടെ മുകളിൽ ഇന്ത്യക്കാരൻ നിർമ്മിച്ച പെർപ്ലക്സിറ്റി ഉപയോഗിക്കുക. പ്രൈവസി ഉറപ്പാക്കുന്നതിനൊപ്പം അവരുടെ വരുമാനവും വർദ്ധിക്കും, നമ്മുടെ ഡാറ്റ അവർ പരിശീലനത്തിനും കൊമേർഷ്യൽ ആവശ്യങ്ങൾക്കും ഉപയോഗിക്കില്ല എന്ന ഗ്യാരന്റി അവരും തരുന്നില്ല.
ആശങ്ക 5. ഇത് സ്വന്തമായി ഓടിക്കണമെങ്കിൽ വലിയ ചെലവ് വരുമോ?
സൗജന്യമായി വേണമെങ്കിൽ ഡീപ്സീക് അവരുടെ മോഡൽ ഉപയോഗിച്ച് ഉണ്ടാക്കിയ ചാറ്റ്ബോട്ട് ഉപയോഗിക്കാം, അല്ലങ്കിൽ ഹഗ്ഗിംഗ്ഫേസ്/ പെർപ്ലക്സിറ്റി ചാനലുകൾ ഉപയോഗിച്ചും ഈ മോഡൽ റൺ ചെയ്യാം. ഇനി അത് വേണ്ടെങ്കിൽ സ്വന്തമായി മൊബൈൽ ഫോണിൽ ഇട്ട് നമ്മുടെ ഒരു കുഞ്ഞൻ പോക്കറ്റ് എഐ മോഡൽ ആയി വേണമെങ്കിൽ ഉപയോഗിക്കാം. ഇത് പ്രൈവറ്റ് ആണെന്ന് മാത്രമല്ല ഒരു സർവറുമായും കണക്റ്റ് ചെയ്യേണ്ടതുമില്ല. പിന്നെ ചിത്രത്തിൽ കാണുന്ന പോലെ ഒക്കെയിരിക്കും എന്ന് മാത്രം.
വ്യക്തിഗത/ചെറിയ തോതിലുള്ള ഉപയോഗത്തിന്, 32GB റാം അല്ലെങ്കിൽ EC2 മെമ്മറി ഒപ്റ്റിമൈസ് ചെയ്ത ഒരു ഡെസ്ക്ടോപ്പിന് ക്വാണ്ടൈസ്ഡ് 7B/14B മോഡലുകൾ (നേരത്തെ പറഞ്ഞ ഡിസ്റ്റിൽ ചെയ്ത മോഡൽ) പ്രവർത്തിപ്പിക്കാൻ കഴിയും. വലിയ മോഡലുകൾക്കോ ഉപയോഗത്തിനോ, GPU മഷീൻസ് അല്ലെങ്കിൽ ക്ലൗഡ് അധിഷ്ഠിത സേവനങ്ങളോ ഉപയോഗിച്ച് റൺ ചെയ്യാം. ഇവിടെയും ഡീപ്സീക് സെർവറുമായി നമുക്ക് ബന്ധമില്ല.
ഒരു സെർവറിൽ ഓടിക്കണമെങ്കിൽ (ഉദാ. AWS EC2 CPU ഉദാഹരണം)
- പൊതുവായ ആപ്ലിക്കേഷൻ: 16GB+ RAM ഉള്ള ചെറിയ മോഡലുകൾക്ക് (7B പാരാമീറ്ററുകൾ) അനുയോജ്യം.
- മെമ്മറി ഒപ്റ്റിമൈസ് ചെയ്ത മോഡൽ: 64GB+ RAM ഉള്ള വലിയ മോഡലുകൾ (ഉദാ. 14B/70B പാരാമീറ്ററുകൾ) മികച്ചത്. സിപിയു ജിപിയുവിനേക്കാൾ മന്ദഗതിയിലാണ് എന്നതിനാൽ മോഡൽ സ്ലോ ആയിരിക്കും.
ഇനി ഉയർന്ന റാം, ജിപിയു ഉള്ള മെഷീനുകൾ, ലോക്കൽ ക്ലസ്റ്റർ ഒക്കെയുണ്ടെങ്കിൽ നമുക്ക് വലിയ മോഡലുകൾ ആയി ഇത് റൺ ചെയ്യാം.
ചുരുക്കത്തിൽ ഒരു റോബോട്ട് വാങ്ങുന്ന പോലെ കരുതിയാൽ മതി. ചൈനയിൽ ഉണ്ടാക്കി അവരുടെ സോഫ്റ്റ്വെയർ നിയന്ത്രിക്കുന്ന റോബോട്ട് അങ്ങോട്ട് ഡാറ്റ അയച്ച് നമ്മുടെ കാര്യങ്ങൾ നിയന്ത്രിക്കുന്ന അവസ്ഥയാണ് ചാറ്റ്ബോട്ട് ഉപയോഗം. എന്നാൽ റോബോട്ട് വാങ്ങി നമ്മുടെ ഇഷ്ടത്തിന് അസംബിൾ ചെയ്ത് നമ്മൾ പറയുന്ന പോലെ പണി ചെയ്യുന്നതാണ് ഓപ്പൻസോഴ്സ് മോഡൽ. ഇവിടെ റോബോട്ട് അല്ല സോഫ്റ്റ്വെയർ ആയതിനാൽ അതിന് കാശ് വേണ്ട എന്നാൽ നമ്മുടെ കമ്പ്യൂട്ടർ, കറന്റ്, ഓപ്പറേറ്റർ, മെന്റനൻസ് എല്ലാത്തിനും നമ്മൾ കാശ് മുടക്കണം. ഗൂഗിൾ, ആന്ത്രോപിക് ഒക്കെ ആ പണികൾ എല്ലാം അവരുടെ ഡേറ്റ സെർവറുകളിലെ ജിപിയു മെഷീനുകൾ ഉപയോഗിച്ച് നമുക്ക് കാര്യങ്ങൾ ചെയ്ത് തരും. നമ്മൾ അതിന് മാസം ചുരുങ്ങിയത് രണ്ടായിരം രൂപ മുതൽ മേലോട്ട് കൊടുക്കുക അല്ലെങ്കിൽ അവരുടെ സൗജന്യ സേവനം ഉപയോഗിക്കുക. ചോയിസ് നമ്മുടേതാണ്.
ഇനി മിക്കവാറും സംഭവിക്കുന്നത് എല്ലാവരും ഇത് ഉപയോഗിച്ച് മികച്ച മോഡലുകൾ ഉണ്ടാക്കി ക്യാപിറ്റലിസത്തിന്റെ ശരിയായ സ്വഭാവം അനുസരിച്ച് ബിസിനസ്സ് ഉണ്ടാക്കും. അതാണ് ട്രംപ് പറഞ്ഞത് ഇത് ഒരു അവസരമാണ് അല്ലാതെ കരയേണ്ട സമയമല്ല എന്നത്!
#openai #DeepSeek #llm #AI #GPT4o
https://www.facebook.com/share/p/1XMeD24foL/?mibextid=Nif5oz
ഇതൂടെ ഒന്ന് വായിക്കണം
https://www.facebook.com/share/p/1BPKZuy1NF/?
ഡീപ് സീക് എന്ന ചൈനീസ് ആർട്ടിഫിഷ്യൽ എഞ്ചിനീയറിംഗ് ആപ്പ് മൂലം ഇന്നലെ വോൾ സ്ട്രീറ്റിൽ നടന്ന മസാക്കറിൽ എ ഐ രംഗത്തെ അമേരിക്കൻ ഐകൺ ആയ NVIDIA യുടെ മാർക്കറ്റ് ക്യാപ്പിൽ ഏകദേശം 500 ബില്ല്യൻ ഒഴുകി പോയി. അതായത് ഇന്ത്യയുടെ ഫോറിൻ എക്സ്ചേഞ്ച് റിസേർവിന്റെ അടുത്തുള്ള ഒരു തുകയാണ് വൈപ്പ് ഓഫ് ചെയ്തത്. ഓപ്പൺ എ ഐ യ്ക്കും ഇതേ പോലെ വൻ തിരിച്ചടി കിട്ടി.
ഇതെല്ലം സൂചിപ്പിക്കുന്നത് ഞാൻ എല്ലാ കാലത്തും എഴുതുന്ന ഒരു കാര്യമാണ്. അതായത് സ്റ്റോക്ക് മാർക്കറ്റ് എന്നത് ഒരു ഇരട്ട തലയുള്ള വാൾ ആണ്. VALUATION എന്നത് ഊഹങ്ങൾ വെച്ചുള്ള നിറം പിടിപ്പിച്ച കഥകൾ വിൽക്കുന്ന "പണ്ഡിതന്മാർ" പറയുന്നത് പോലെയുള്ളതല്ല, മറിച്ച് സമ്പത്തിന്റെ അളവുകോൽ ആയ യീൽഡ് ബേസ്ഡ് ആണ്. ന്യൂ ജെൻ എന്നോ ഓൾഡ് ജെൻ എന്നോ ബ്രിക്ക് ആൻഡ് മോർട്ടാർ എന്നോ ഒന്നും തരം തിരിവിന്റെ കാര്യമില്ല. എല്ലാ VALUATION മോഡലും നെറ്റ് പ്രേസേന്റ്റ് വാല്യൂ ഓഫ് future ക്യാഷ് ഫ്ലോയിൽ അധിഷ്ടിതമാണ്.
ഇന്ത്യൻ സ്റ്റോക്ക് മാർക്കറ്റ് കുതിച്ചു പായുമ്പോൾ ആസനത്തിലെ മഞ്ഞ മാറാത്ത കുറെ അലവലാതികളുടെ യു ട്യൂബ് അഡ്വൈസ് കേട്ട് ചാടിക്കളിച്ച കൊച്ചുരാമന്മാരുടെ ശ്മശാനം ആണല്ലോ ഇപ്പോൾ കാണുന്നത്. ഇന്നത്തെ സ്മോൾ ക്യാപ് നാളത്തെ മിഡ് ക്യാപ്, മറ്റന്നാളത്തെ ലാർജ് ക്യാപ് എന്നൊക്കെ അടിച്ചു വിട്ട കുറെ തെണ്ടികൾ മൂലം ഊള നിക്ഷേപകർ കറവയുള്ള പശുവിനെ വിറ്റ് പേ പിടിച്ച പട്ടിയെ വാങ്ങിയ അവസ്ഥയിലായി.
അതൊക്കെ അവിടെ നിൽക്കട്ടെ. ഞാൻ മറ്റൊരു കാര്യമാണ് ഡീപ് സീക് പ്രേമികളോട് പറയാനാഗ്രഹിക്കുന്നത്. അത് പറയുമ്പോൾ അമേരിക്കൻ സ്റ്റൂജ് ആക്കരുതെന്ന് അപേക്ഷിക്കുന്നു. ചൈനീസ് എ ഐ ചിപ്പുകൾ വഴി ആ മേഖല താത്കാലികമായി അമേരിക്കയുടെ അപ്രമാദിത്വം ചോദ്യം ചെയ്തേക്കാം. പക്ഷെ മെറിറ്റ്, അതിന് മാത്രം വിലയുള്ള ഒരു ഓപ്പൺ സൊസൈറ്റി ആയ അമേരിക്കൻ കോര്പറേറ്റസ് അധികം താമസിക്കാതെ സൊ called ചൈനീസ് " മേധാവിത്തം" തകർക്കും. കാരണം അവർ ഓപ്പൺ സൊസൈറ്റി ആണെന്നത് തന്നെ. നാം കടന്ന് പോകുന്ന ഈ യുഗം സോഷ്യൽ ക്യാപിറ്റലിസത്തിന്റേതാണ്. അല്ലാതെ സ്റ്റേറ്റിന്റെ വരുതിക്ക് നിൽക്കുന്ന സയൻസും ക്യാപിറ്റലും അധികം ഇന്നവേഷൻ കൊണ്ട് വരില്ല. അത് പറയുമ്പോൾ ഇന്നലെ ഞാൻ എഴുതിയ വാഹന രംഗത്തെ ചൈനീസ് മേധാവിത്ത തിയറി മറന്നോ എന്ന് ചോദിക്കരുത്. അത് മാനുഫാക്ച്ചറിങ് ആണ്. അടിമ പണി മാത്രമേ ഭൗതികമായി ചെയ്യിക്കാൻ ആകൂ. ബൗദ്ധിക തലത്തിലുള്ള മുന്നോട്ട് പോക്ക് ഓപ്പൺ സൊസൈറ്റിയിൽ മാത്രമേ നില നിൽക്കൂ. സംശയമുള്ളവർ സ്പേസ്, സയൻസ് രംഗത്ത് ഒരു കാലത്ത് അമേരിക്കയ്ക്ക് മുന്നിൽ വിലസിയ സോവിയറ്റുകളുടെ അവസ്ഥ നോക്കിയാൽ മതി.
അവസാനമായി ഒരു കാര്യം കൂടി പറഞ്ഞോട്ടെ.
മേൽ പറഞ്ഞ ഡീപ് സീക്കിനോട് ഒരു ചോദ്യം ചോദിക്കുക.
ടിയാനൻമെൻ സ്ക്വയറിൽ നടന്ന കൂട്ട കുരുതി എന്തായിരുന്നു?
അതിന് കൃത്യമായ മറുപടി പറഞ്ഞാൽ ഡീപ്പ് സീക്കിന്റെ കട PLA പൂട്ടിക്കും. സ്റ്റാർട്ട് അപ്പ് ന്റെ പിന്നിലുള്ള ചെക്കന്മാർ പടമാകും. എന്നാൽ ചാറ്റ് ജിപിടി യോട് ട്രംപ് വട്ടൻ ആണോ എന്ന് ചോദിക്കൂ. ആണെന്ന് ചിലപ്പോൾ ഉത്തരം തരും. അത്രേയുള്ളൂ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്.
ചൈന അമേരിക്കയെ മലർത്തിയടിക്കുക തന്നെ ചെയ്യും
അമേരിക്കയുടെ സാമ്രാജ്യത്തം പോലെ തന്നെ മറ്റൊരു തെണ്ടിത്തരം ആണ് ലോകത്ത് രാഷ്ട്രീയ,വാണിജ്യ, വ്യാപാര,ഉത്പാദന,ശാസ്ത്ര,സാങ്കേതിക മേഖലകളിൽ ഞങ്ങൾ മാത്രം മുൻപന്തിയിൽ പാടുള്ളൂ എന്നും കുത്തക അധികാര നിയത്രണങ്ങൾ തങ്ങളിൽ മാത്രം ഒതുങ്ങി നിൽക്കണം എന്നുമുള്ള നിലപാട്
എന്നാൽ അമേരിക്ക യുടെ ഇ അഹങ്കാരത്തിനു സമസ്ത മേഖലയിൽ നിന്നും കനത്ത പ്രഹരമാണ് ചൈനയിൽ നിന്നും കിട്ടുന്നത് അതിന്റെ അവസാനത്തെ രണ്ടു മൂന്ന് ഉദ്ധാരണമാണ് അടുത്തിടെ പുറത്തുവന്ന ഡീപ് സീക്കും, കൃത്രിമ സൂര്യന്റെ പരീക്ഷണവും പുരോഗതിയും, ആറാം തലമുറ സ്റ്റേൽത് യുദ്ധവിമാന മായ വൈറ്റ് എംപ്പറർ പരീക്ഷണ പറക്കൽ വിജയകരമായി നടത്തിയതും
ഇതൊക്കെ അമേരിക്കയുടെ രാഷ്ട്രീയ, വാണിജ്യ, വ്യാപാര മേഖലകളിൽ വലിയ പ്രകമ്പനമാണ് സൃഷ്ടിക്കുന്നത്
5g ടെക്നോളജി അമേരിക്കയേക്കാൾ മുന്നെ ലോകത്തു വ്യാപകമാക്കിയത് ചൈനയാണ് അതിനു തടയിടാൻ വാവേയെ പരമാവധി കുപ്രചാരണങ്ങളും ഉപരോധവും ഏർപ്പെടുത്തി തളർത്തി എന്നാൽ 6g യിൽ ഒരു കുതിച്ചു ചാട്ടത്തിന് തയ്യാറായി നിൽക്കുകയാണ് ചൈന.
സ്റ്റാർലിങ്കിനെ ഭഹിരകാശത്തുനിന്ന് വെട്ടിയിടാൻ തയ്യാറായി നിൽക്കുകയാണ് ഗോവാങ് എന്ന ചൈനിസ് സാറ്റലൈറ്റ് ഇന്റർനെറ്റ് കമ്പനി
പതിമൂവായിരം മുതൽ പതിനയ്യായിരം വരെ സാറ്റലൈറ്റുകളെ ഓർബിറ്റലിൽ എത്തിക്കുന്ന പ്രക്രിയ ഘട്ടം ഘട്ടമായി തുടങ്ങി അവർ.
സ്പേസ് X നു ബദലായി ലാൻഡ് സ്പേസ്
ഫാൽക്കനു ബദലായി
zhuque റീ യൂസബിൾ റോക്കറ്റ്
സ്വന്തമായി ഭഹിരകാശനിലയം
അങ്ങനെ ബഹിരാകാശത്ത് ചൈനിസ് പുതുയുഗം
അതിനു തായേ ആകാശത്തു എയർ ബസ്സിനോടും, ബോയ്ങ്ങിഗ് നോടും മത്സരിക്കാൻ ചൈനിസ് പാസ്സൻജർ വിമാന നിർമാതാക്കളായ കോമാക്
ടെസ്ലയെ തുരത്താൻ byd, nio,ഷാവോമി
അങ്ങനെ പലതും
ചാറ്റ് ജിപിറ്റി യെ ഡീപ് സീക്ക് മലർത്തിയടിച്ചെങ്കിൽ ഇന്ന് ചൈന നേരിടുന്ന ഏറ്റവും വലിയ വെല്ലുവിളിയായഅഡ്വാൻസ്ഡ് ai ചിപ്പുകളും അവ ഉണ്ടാക്കുന്ന ലിതോഗ്രാഫി മെഷീനും ചൈനയിലേക്ക് കയറ്റി അയക്കുന്നത് നിറുത്തി ചൈനയുടെ കുത്തിപ്പിന് തടയിടാൻ അമേരിക്കയും സഖ്യ രാഷ്ട്രങ്ങളും ഇപ്പോൾ കൊണ്ടുവന്ന ഉപരോധവും ചൈനിസ് കമ്പനികൾ പുതിയ കണ്ടുപിടുത്തം വഴി അതിജീവിക്കും അങ്ങനെ വന്നാൽ
Asml,tsmc , nvidia, google, samsaung തുടങ്ങിയവരുടെ ആപ്പീസ് പൂട്ടും
ആൻഡ്രോയിഡിന് പകരം ഹാർമണിയും
ഗൂഗിളിന് പകരം ബൈദുവും
വഹട്സപ്പിന് പകരം വിചാറ്റും
എക്സ് നു പകരം വെയ്ബോയും
ഫേസ്ബുക് നു പകരം റെൻ റെനും
പകരക്കാരനായി വർഷങ്ങൾക്കുള്ളിൽ തന്നെ ലോകത്താകമാനം ഫോണിൽ കയറിക്കൂടും
അതോടെ അതോടെ സിലിക്കൻ വാലിയും അമേരിക്കയും ഓർമയാകും.
No comments:
Post a Comment