వ్యవస్థాపకులు, విమర్శకులు మరియు పరిశోధకులు: చదవాల్సిన సంభాషణలు
చాలామంది OpenAI CEO పేరు చెప్పగలరు. కానీ, ప్రస్తుత లార్జ్ లాంగ్వేజ్ మోడల్స్ (LLMs) యుగాన్ని నిర్వచించిన పరిశోధనా పత్రాల రచయితల పేర్లు చెప్పేవారు తక్కువ. ఈ జ్ఞాన లోపం సాంకేతికత ఎలా అభివృద్ధి చెందుతుందనే దానిపై తప్పుడు అవగాహనను కలిగిస్తుంది. మనం ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ను వరుస ఉత్పత్తుల లాంచ్లుగా చూస్తాం, కానీ నిజానికి ఇది గణితపరమైన పురోగతుల నెమ్మదైన సంచితం. వ్యవస్థాపకులు మూలధనాన్ని మరియు పబ్లిక్ నెరేటివ్ను నిర్వహిస్తారు. పరిశోధకులు వెయిట్స్ మరియు లాజిక్ను నిర్వహిస్తారు. ఈ తేడాను అర్థం చేసుకోవడం మార్కెటింగ్ మాయాజాలాన్ని దాటి చూడటానికి ఏకైక మార్గం. మీరు వ్యవస్థాపకులను మాత్రమే అనుసరిస్తే, మీరు ఒక సినిమా చూస్తున్నట్లు. పరిశోధకులను అనుసరిస్తే, మీరు స్క్రిప్ట్ చదువుతున్నట్లు. ఈ వ్యాసం ఈ వ్యత్యాసం ఎందుకు ముఖ్యమో మరియు పరిశ్రమ భవిష్యత్తును నిర్ణయించే సంకేతాలను ఎలా గుర్తించాలో వివరిస్తుంది. మనం ఆకర్షణీయమైన ప్రసంగాలను దాటి, ల్యాబ్లోని వాస్తవికతను చూద్దాం. ప్రెస్ రిలీజ్లపై సంతకం చేసే వారి కంటే, కోడ్ రాసే వారిపై దృష్టి పెట్టాల్సిన సమయం ఇది.
మెషిన్ యుగం యొక్క అదృశ్య శిల్పులు
వ్యవస్థాపకులు బహిరంగ ముఖం. వారు వరల్డ్ ఎకనామిక్ ఫోరమ్లో మాట్లాడుతారు మరియు కాంగ్రెస్ ముందు సాక్ష్యమిస్తారు. వారి పని బిలియన్ల కొద్దీ ఫండింగ్ సేకరించడం మరియు అనివార్యమైన బ్రాండ్ను నిర్మించడం. వారు మాయాజాలాన్ని సూచించే పదాలను ఉపయోగిస్తారు. పరిశోధకులు భిన్నమైన వారు. వారు Python మరియు LaTeX లలో పని చేస్తారు. వారికి లాస్ ఫంక్షన్స్ మరియు టోకెన్ ఎఫిషియన్సీ ముఖ్యం. ఒక వ్యవస్థాపకుడు తన మోడల్ ఆలోచిస్తోందని చెప్పవచ్చు. ఒక పరిశోధకుడు అది ఒక నిర్దిష్ట ప్రాబబిలిటీ డిస్ట్రిబ్యూషన్ ఆధారంగా తదుపరి వచ్చే పదాన్ని అంచనా వేస్తుందని చెబుతాడు. మీడియా ఈ రెండు వర్గాలను ఒకటిగా చూడటం వల్ల గందరగోళం ఏర్పడుతుంది. ఒక CEO తన మోడల్ వాతావరణ మార్పును పరిష్కరిస్తుందని చెప్పడం సేల్స్ పిచ్. ఒక పరిశోధకుడు స్పార్స్ ఆటోఎన్కోడర్లపై పేపర్ ప్రచురించడం సాంకేతిక వాదన. ఒకటి ఆశ, మరొకటి వాస్తవం.
ప్రజలు తరచుగా ఆశను వాస్తవంగా పొరబడతారు. ఇది అతిగా వాగ్దానం చేయడం మరియు తక్కువ డెలివరీ చేయడం అనే చక్రానికి దారితీస్తుంది. ఈ రంగాన్ని అర్థం చేసుకోవడానికి, కారును అమ్మే వ్యక్తిని మరియు ఇంజిన్ డిజైన్ చేసిన వ్యక్తిని వేరు చేయాలి. ఇంజిన్ డిజైనర్కు బోల్ట్లు ఎక్కడ వదులుగా ఉన్నాయో ఖచ్చితంగా తెలుసు. సేల్స్పర్సన్ ఎప్పుడూ ఆ వదులైన బోల్ట్ల గురించి చెప్పరు, ఎందుకంటే వారి పని స్టాక్ ధరను ఎక్కువగా ఉంచడం. ప్రతి కొత్త మోడల్ వచ్చినప్పుడు ఇది జరుగుతుంది. వ్యవస్థాపకుడు హైప్ పెంచడానికి ఒక రహస్యమైన ట్వీట్ చేస్తారు. పరిశోధకుడు arXiv లోని సాంకేతిక నివేదికకు లింక్ పోస్ట్ చేస్తారు. ట్వీట్కు మిలియన్ల వ్యూస్ వస్తాయి. సాంకేతిక నివేదికను నిజంగా పని చేసే కొద్దిమంది మాత్రమే చదువుతారు. ఇది అత్యంత బిగ్గరగా వినిపించే గొంతులు అందరికీ వాస్తవికతను నిర్వచించే ఫీడ్బ్యాక్ లూప్ను సృష్టిస్తుంది.
ఆవిష్కరణల బహిరంగ ముఖం దాటి
ఈ విభజన ప్రపంచ విధానాలపై భారీ ప్రభావాలను చూపుతుంది. ప్రభుత్వాలు ప్రస్తుతం వ్యవస్థాపకుల హెచ్చరికల ఆధారంగా చట్టాలను రూపొందిస్తున్నాయి. ఈ వ్యవస్థాపకులు తరచుగా సైన్స్ ఫిక్షన్ లాంటి అస్తిత్వ ప్రమాదాల గురించి హెచ్చరిస్తుంటారు. ఇది ప్రస్తుత హాని కంటే ఊహాజనిత భవిష్యత్తులపై దృష్టిని ఉంచుతుంది. అదే సమయంలో, పరిశోధకులు డేటా బయాస్ మరియు ఇంధన వినియోగం వంటి తక్షణ సమస్యలను ఎత్తి చూపుతున్నారు. ప్రసిద్ధ పేర్లను మాత్రమే వినడం ద్వారా, మనం తప్పు విషయాలను నియంత్రించే ప్రమాదం ఉంది. మనం భవిష్యత్తులో వచ్చే సూపర్ ఇంటెలిజెన్స్ను నిషేధించవచ్చు, కానీ ప్రస్తుత మోడల్స్ తమ డేటా సెంటర్లను చల్లబరచడానికి చిన్న పట్టణాల నీటి వనరులను ఖాళీ చేస్తున్నాయనే వాస్తవాన్ని విస్మరించవచ్చు. ఇది కేవలం అమెరికన్ సమస్య మాత్రమే కాదు. యూరప్ మరియు ఆసియాలో కూడా ఇదే పరిస్థితి ఉంది.
అత్యధిక మార్కెటింగ్ బడ్జెట్ ఉన్నవారి గొంతులే ఎక్కువగా వినిపిస్తాయి. ఇది కొన్ని కంపెనీలు మొత్తం గ్రహం కోసం ఎజెండాను నిర్ణయించే విజేత-అంతా-తీసుకునే వాతావరణాన్ని సృష్టిస్తుంది. మనం మన దృక్పథాన్ని విస్తరించకపోతే, సిలికాన్ వ్యాలీలోని కొద్దిమంది వ్యక్తులు ఏది సురక్షితం మరియు ఏది సాధ్యమో నిర్ణయించేలా అనుమతిస్తాము. ఈ అధికార కేంద్రీకరణ ఒక ప్రమాదం. ఇది అవసరమైన రంగంలో ఆలోచనా వైవిధ్యాన్ని పరిమితం చేస్తుంది. మనం శాన్ ఫ్రాన్సిస్కోలోని వ్యక్తుల నుండి విన్నట్లే, టొరంటో విశ్వవిద్యాలయం లేదా టోక్యోలోని ల్యాబ్ల నుండి కూడా వినాలి. శాస్త్రీయ పురోగతి ఒక ప్రపంచ ప్రయత్నం, కానీ కథనం ప్రస్తుతం స్థానిక గుత్తాధిపత్యంగా ఉంది. కార్పొరేట్ బోర్డ్రూమ్ల వెలుపల జరుగుతున్న నిజమైన పురోగతిని చూడటానికి మనం Nature వంటి జర్నల్స్ను చూడాలి.
ప్రపంచం ఎందుకు తప్పు వ్యక్తులను వింటుంది
ఒక ప్రధాన ల్యాబ్లోని లీడ్ రీసెర్చర్ రోజును పరిశీలించండి. వారు నిద్రలేచి మూడు మిలియన్ డాలర్ల ఖర్చుతో కూడిన ట్రైనింగ్ రన్ ఫలితాలను తనిఖీ చేస్తారు. మోడల్ ఊహించిన దానికంటే ఎక్కువ హాలూసినేషన్స్ చేస్తోందని వారు గమనిస్తారు. నాయిస్ను కనుగొనడానికి వారు పది గంటల పాటు డేటా క్లస్టర్లను పరిశీలిస్తారు. వారు 2024 ఎన్నికల గురించి లేదా మానవాళి భవిష్యత్తు గురించి ఆలోచించడం లేదు. సంక్లిష్ట వాక్యాలలో నెగేషన్ను అర్థం చేసుకోవడంలో మోడల్ ఎందుకు విఫలమవుతుందో వారు ఆలోచిస్తున్నారు. వారు న్యూరాన్ యాక్టివేషన్ హీట్ మ్యాప్లను చూస్తున్నారు. వారి విజయం బిట్స్ పర్ క్యారెక్టర్ లేదా ఒక నిర్దిష్ట బెంచ్మార్క్ ఖచ్చితత్వంపై కొలుస్తారు. ఇప్పుడు ఒక వ్యవస్థాపకుడి రోజును చూడండి. వారు దేశాధినేతను కలవడానికి ప్రైవేట్ జెట్లో ఉన్నారు. వారు కొత్త ఆర్థిక వ్యవస్థలో ట్రిలియన్ డాలర్ల అవకాశం గురించి మాట్లాడుతున్నారు.
పరిశోధకుడు ‘ఎలా’ అనే దానితో వ్యవహరిస్తారు. వ్యవస్థాపకుడు అది డబ్బుకు ఎందుకు విలువైనదో అనే దానితో వ్యవహరిస్తారు. యాప్ నిర్మించే డెవలపర్కు, పరిశోధకుడు ముఖ్యమైన వ్యక్తి. పరిశోధకుడు API లాటెన్సీ మరియు కాంటెక్స్ట్ విండోను నిర్ణయిస్తారు. వ్యవస్థాపకుడు ధరను నిర్ణయిస్తారు. మీరు వ్యాపారాన్ని నిర్మించడానికి ప్రయత్నిస్తుంటే, వ్యవస్థాపకుడు చెప్పేది సాంకేతికత నిజంగా చేయగలదా అని మీరు తెలుసుకోవాలి. తరచుగా, అది చేయలేదు. అటానమస్ డ్రైవింగ్ ప్రారంభ రోజుల్లో మనం దీనిని చూశాము. 2026 నాటికి మిలియన్ల కొద్దీ రోబోటాక్సీలు ఉంటాయని వ్యవస్థాపకులు చెప్పారు. భారీ వర్షంలో ఎడ్జ్ కేసులు ఇంకా పరిష్కరించని సమస్య అని పరిశోధకులకు తెలుసు. ప్రజలు వ్యవస్థాపకులను నమ్మారు. పరిశోధకులు చెప్పిందే నిజమైంది.
ఈ అదే నమూనా జనరేటివ్ AI స్పేస్లో పునరావృతమవుతోంది. మోడల్స్ త్వరలో లాయర్లు మరియు డాక్టర్లను భర్తీ చేస్తాయని మనకు చెబుతున్నారు. మీరు సాంకేతిక పత్రాలను చదివితే, మోడల్స్ ఇప్పటికీ ప్రాథమిక తార్కిక స్థిరత్వంతో ఇబ్బంది పడుతున్నాయని మీకు అర్థమవుతుంది. డెమో మరియు వాస్తవికత మధ్య ఉన్న అంతరం కంపెనీలు డబ్బును కోల్పోయే చోటు. ఈ సాంకేతిక పరిమితులు నేడు ఎలా పరీక్షించబడుతున్నాయో చూడటానికి మీరు ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ ట్రెండ్స్పై డీప్ డైవ్ చూడవచ్చు. ఈ వ్యత్యాసం ఒక మంచి పెట్టుబడికి మరియు ఊహాజనిత బుడగకు మధ్య ఉన్న తేడా. మీరు కొత్త క్లెయిమ్ విన్నప్పుడు, అది పేపర్ నుండి వచ్చిందా లేదా ప్రెస్ రిలీజ్ నుండి వచ్చిందా అని మిమ్మల్ని మీరు ప్రశ్నించుకోండి. సమాధానం దానికి ఎంత ప్రాముఖ్యత ఇవ్వాలో చెబుతుంది. MIT Technology Review లోని జర్నలిస్టులు తరచుగా ల్యాబ్ మరియు లాబీ మధ్య ఉన్న ఈ అంతరాన్ని హైలైట్ చేస్తారు. వ్యవస్థాపకులు లోపాలను దాచడానికి ప్రోత్సహించబడతారని, పరిశోధకులు వాటిని కనుగొనడానికి ప్రోత్సహించబడతారని మనం గుర్తుంచుకోవాలి. మొదటిది హైప్ను నిర్మిస్తుంది మరియు రెండోది సత్యాన్ని నిర్మిస్తుంది. దీర్ఘకాలంలో, సత్యం మాత్రమే నిలబడుతుంది. సాంకేతిక వాస్తవికత బరువుతో హైప్ మొదటి అల చల్లబడటం ప్రారంభించినప్పుడు 2026 లో మనం దీనిని చూశాము.
ల్యాబ్లో ఒక మంగళవారం వర్సెస్ బోర్డ్రూమ్
అభివృద్ధి యొక్క ప్రస్తుత మార్గం గురించి మనం కష్టమైన ప్రశ్నలను అడగాలి. వ్యవస్థాపకులు అందరికీ ప్రయోజనం చేకూరుస్తుందని చెప్పే పరిశోధన కోసం ఎవరు చెల్లిస్తున్నారు? అగ్రశ్రేణి పరిశోధకులలో ఎక్కువమంది అకాడెమియా నుండి ప్రైవేట్ ల్యాబ్లకు వెళ్లిపోయారు. అంటే వారు ఉత్పత్తి చేసే జ్ఞానం ఇకపై ప్రజా ప్రయోజనం కాదు. ఇది కార్పొరేట్ రహస్యం. ఒక పాయింట్ను నిరూపించడానికి ఉపయోగించే డేటా పేవాల్ వెనుక దాగి ఉంటే శాస్త్రీయ పద్ధతికి ఏమవుతుంది? మనం ఓపెన్ సైన్స్ నుండి క్లోజ్డ్ కాంపిటేటివ్ అడ్వాంటేజ్ మోడల్ వైపు మళ్లడాన్ని చూస్తున్నాము. కొద్దిమంది వ్యక్తుల కీర్తి రంగానికి సహాయపడుతుందా లేదా అసమ్మతిని నిరుత్సాహపరిచే వ్యక్తిత్వ ఆరాధనను సృష్టిస్తుందా? ఒక పరిశోధకుడు ఫ్లాగ్షిప్ మోడల్లో ప్రధాన లోపాన్ని కనుగొంటే, అది కంపెనీ విలువను తగ్గించగలదని తెలిసినప్పుడు దానిని రిపోర్ట్ చేయడానికి వారు సురక్షితంగా భావిస్తారా?
BotNews.today కంటెంట్ను పరిశోధించడానికి, వ్రాయడానికి, సవరించడానికి మరియు అనువదించడానికి AI సాధనాలను ఉపయోగిస్తుంది. మా బృందం సమాచారాన్ని ఉపయోగకరంగా, స్పష్టంగా మరియు విశ్వసనీయంగా ఉంచడానికి ప్రక్రియను సమీక్షిస్తుంది మరియు పర్యవేక్షిస్తుంది.
ఈ సంస్థలపై ఆర్థిక ఒత్తిడి విపరీతంగా ఉంది. మనం పర్యావరణ వ్యయాన్ని కూడా పరిగణనలోకి తీసుకోవాలి. కొంచెం మెరుగైన బెంచ్మార్క్ల కోసం ఈ మోడల్స్ను ట్రైన్ చేయడానికి అయ్యే భారీ కార్బన్ ఫుట్ప్రింట్ విలువైనదేనా? మనం తరచుగా పర్యావరణం కోసం AI ప్రయోజనాల గురించి మాట్లాడుతాము, కానీ రెండింటినీ బ్యాలెన్స్ చేసే లెడ్జర్ను మనం అరుదుగా చూస్తాము. చివరగా, ఈ మోడల్స్ దేనిపై ట్రైన్ చేయబడ్డాయో ఆ సంస్కృతికి యజమాని ఎవరు? పరిశోధకులు తమ సిస్టమ్స్ను నిర్మించడానికి ఇంటర్నెట్ యొక్క సామూహిక అవుట్పుట్ను ఉపయోగిస్తారు. వ్యవస్థాపకులు ఆ తర్వాత అదే అవుట్పుట్ యొక్క డిస్టిల్డ్ వెర్షన్ను యాక్సెస్ చేయడానికి ప్రజల నుండి ఛార్జ్ చేస్తారు. ఇది సంపద బదిలీ, దీని గురించి హెడ్లైన్స్లో అరుదుగా చర్చించబడుతుంది. ఇవి కేవలం సాంకేతిక సమస్యలు మాత్రమే కాదు. ఇవి సామాజిక మరియు నైతిక సందిగ్ధతలు, వీటిని పరిష్కరించడానికి మెరుగైన అల్గోరిథం కంటే ఎక్కువ అవసరం.
సాంకేతిక పరిమితులు మరియు స్థానిక అమలు
ఈ ప్లాట్ఫారమ్లపై నిర్మించే వారికి, ఫిలాసఫీ కంటే సాంకేతిక వివరాలు ముఖ్యం. ప్రస్తుత API పరిమితులు ఎంటర్ప్రైజ్ అడాప్షన్ కోసం ఒక ప్రధాన అడ్డంకి. చాలా ప్రొవైడర్లకు కఠినమైన రేట్ లిమిట్స్ ఉన్నాయి, ఇవి హై వాల్యూమ్ రియల్ టైమ్ ప్రాసెసింగ్ను నిరోధిస్తాయి. అందుకే చాలా సంస్థలు లోకల్ స్టోరేజ్ మరియు లోకల్ ఎగ్జిక్యూషన్ వైపు చూస్తున్నాయి. లోకల్ హార్డ్వేర్పై Llama 3 వంటి మోడల్స్ను ఉపయోగించడం వల్ల మెరుగైన డేటా ప్రైవసీ మరియు తక్కువ దీర్ఘకాలిక ఖర్చులు ఉంటాయి. అయితే, హార్డ్వేర్ అవసరాలు చాలా ఎక్కువ. 70 బిలియన్ పారామీటర్ మోడల్ను మంచి వేగంతో రన్ చేయడానికి, మీకు గణనీయమైన VRAM ఉన్న హై-ఎండ్ GPUలు అవసరం. ఇక్కడే గీక్ సెక్షన్ ఆర్థిక విభాగంతో కలుస్తుంది. H100 క్లస్టర్ ఖర్చు ఒక ప్రవేశ అడ్డంకి, ఇది అధికారాన్ని ధనికుల చేతుల్లోనే ఉంచుతుంది.
మనం స్పెషలైజ్డ్ ఫైన్ ట్యూనింగ్ వైపు కూడా మళ్లుతున్నాము. ప్రతిదానికీ జనరల్ మోడల్ను ఉపయోగించే బదులు, డెవలపర్లు నిర్దిష్ట డేటాసెట్లపై ట్రైన్ చేసిన చిన్న మోడల్స్ను ఉపయోగిస్తున్నారు. ఇది ఖచ్చితత్వాన్ని మెరుగుపరుస్తుంది మరియు టోకెన్ కౌంట్ను తగ్గిస్తుంది. ఇక్కడ సాంకేతిక సవాలు డేటా క్యూరేషన్. ఇన్పుట్ డేటా పేలవంగా ఉంటే, ఫైన్ ట్యూన్ చేసిన మోడల్ జనరల్ మోడల్ కంటే అధ్వాన్నంగా ఉంటుంది. మోడల్స్ను వాస్తవిక డేటాపై గ్రౌండ్ చేయడానికి Retrieval Augmented Generation (RAG) వినియోగం కూడా పెరుగుతోంది. ఇది భారీ కాంటెక్స్ట్ విండోల అవసరాన్ని దాటవేస్తుంది మరియు హాలూసినేషన్స్ను తగ్గిస్తుంది. కానీ RAGకి దాని స్వంత పరిమితులు ఉన్నాయి, ముఖ్యంగా రిట్రీవ్ చేసిన డాక్యుమెంట్లను ర్యాంక్ చేయడంలో. సెర్చ్ స్టెప్ విఫలమైతే, మోడల్ అవుట్పుట్ పనికిరాదు. AI పనితీరు మోడల్ మీద ఎంత ఆధారపడుతుందో, అది క్వెరీ చేసే డేటాబేస్ మీద కూడా అంతే ఆధారపడుతుందని చాలా మంది వినియోగదారులకు తెలియదు.
సమాచారం కోసం చివరి ఫిల్టర్
AI భవిష్యత్తు ఒకే వ్యక్తి చెప్పే ఒకే కథ కాదు. ఇది విజన్ను అమ్మే వారికి మరియు వాస్తవికతను నిర్మించే వారికి మధ్య జరుగుతున్న గందరగోళమైన, కొనసాగుతున్న చర్చ. టెక్ వార్తలను తెలివిగా వినియోగించుకోవాలంటే, మీరు ఆకర్షణీయమైన వ్యవస్థాపకుడిని దాటి చూడటం నేర్చుకోవాలి. పేపర్లపై ఉన్న పేర్ల కోసం చూడండి. తమ మోడల్స్ ఏమి చేయలేవో చెప్పడానికి సిద్ధంగా ఉన్న పరిశోధకుల కోసం చూడండి. పరిశ్రమలోని వైరుధ్యాలు బగ్స్ కావు. అవి కథలో అత్యంత నిజాయితీ గల భాగం. సాంకేతిక సమస్యలు ఇంకా పరిష్కారం కాలేదు కాబట్టి ఈ రంగం అభివృద్ధి చెందుతూనే ఉంటుంది. ఒక లైవ్ ప్రశ్న ఇంకా మిగిలే ఉంది: ప్రస్తుత యుగాన్ని నిర్వచించే భారీ వనరుల వినియోగం లేకుండా మనం నిజంగా తెలివైన సిస్టమ్ను నిర్మించగలమా? మనం దానికి సమాధానం ఇచ్చే వరకు, హైప్ సైన్స్ కంటే వేగంగా కొనసాగుతుంది. ఇందులో ఉన్న ట్రేడ్-ఆఫ్లను ప్రస్తావించకుండా పరిపూర్ణ పరిష్కారాన్ని వాగ్దానం చేసే ఏ కథనం పట్ల అయినా మనం సందేహాస్పదంగా ఉండాలి.
ఎడిటర్ గమనిక: కంప్యూటర్ గీక్స్ కాని, కానీ కృత్రిమ మేధస్సును అర్థం చేసుకోవాలనుకునే, దానిని మరింత విశ్వాసంతో ఉపయోగించాలనుకునే మరియు ఇప్పటికే వస్తున్న భవిష్యత్తును అనుసరించాలనుకునే వ్యక్తుల కోసం మేము ఈ సైట్ను బహుభాషా AI వార్తలు మరియు గైడ్ల హబ్గా సృష్టించాము.
ఒక లోపాన్ని కనుగొన్నారా లేదా సరిదిద్దాల్సిన ఏదైనా ఉందా? మాకు తెలియజేయండి.