విషయ సూచిక
PDF ఫైల్లోని స్ప్రెడ్షీట్ నుండి మైక్రోసాఫ్ట్ ఎక్సెల్ షీట్కి డేటాను బదిలీ చేసే పని ఎల్లప్పుడూ “సరదా”. ప్రత్యేకించి మీకు FineReader వంటి ఖరీదైన గుర్తింపు సాఫ్ట్వేర్ లేదా అలాంటిదేమీ లేకుంటే. డైరెక్ట్ కాపీయింగ్ సాధారణంగా ఏదైనా మంచికి దారితీయదు, ఎందుకంటే. కాపీ చేసిన డేటాను షీట్లో అతికించిన తర్వాత, అవి ఒక నిలువు వరుసలో "కలిసి ఉంటాయి". కాబట్టి వాటిని ఒక సాధనాన్ని ఉపయోగించి చాలా శ్రమతో వేరుచేయవలసి ఉంటుంది నిలువు వరుసల వారీగా వచనం ట్యాబ్ నుండి సమాచారం (డేటా — వచనం నుండి నిలువు వరుసలు).
మరియు వాస్తవానికి, టెక్స్ట్ లేయర్ ఉన్న PDF ఫైల్లకు మాత్రమే కాపీ చేయడం సాధ్యమవుతుంది, అంటే పేపర్ నుండి PDFకి స్కాన్ చేసిన పత్రంతో, ఇది సూత్రప్రాయంగా పనిచేయదు.
కానీ ఇది చాలా విచారకరం కాదు, నిజంగా 🙂
మీకు ఆఫీస్ 2013 లేదా 2016 ఉంటే, కొన్ని నిమిషాల్లో, అదనపు ప్రోగ్రామ్లు లేకుండా, PDF నుండి Microsoft Excelకి డేటాను బదిలీ చేయడం చాలా సాధ్యమే. మరియు వర్డ్ మరియు పవర్ క్వెరీ ఇందులో మాకు సహాయం చేస్తుంది.
ఉదాహరణకు, యూరప్ కోసం ఎకనామిక్ కమిషన్ వెబ్సైట్ నుండి టెక్స్ట్, ఫార్ములాలు మరియు టేబుల్ల సమూహంతో ఈ PDF నివేదికను తీసుకుందాం:
… మరియు Excelలో దాని నుండి తీసివేయడానికి ప్రయత్నించండి, మొదటి పట్టిక చెప్పండి:
లెట్ యొక్క వెళ్ళి!
దశ 1. వర్డ్లో PDFని తెరవండి
కొన్ని కారణాల వల్ల, కొంతమందికి తెలుసు, కానీ 2013 నుండి మైక్రోసాఫ్ట్ వర్డ్ PDF ఫైల్లను తెరవడం మరియు గుర్తించడం నేర్చుకుంది (స్కాన్ చేసినవి కూడా, అంటే టెక్స్ట్ లేయర్ లేకుండా!). ఇది పూర్తిగా ప్రామాణిక మార్గంలో జరుగుతుంది: ఓపెన్ వర్డ్, క్లిక్ చేయండి ఫైల్ - తెరవండి (ఫైల్ - ఓపెన్) మరియు విండో యొక్క దిగువ కుడి మూలలో ఉన్న డ్రాప్-డౌన్ జాబితాలో PDF ఆకృతిని పేర్కొనండి.
తర్వాత మనకు కావాల్సిన PDF ఫైల్ని ఎంచుకుని క్లిక్ చేయండి ఓపెన్ (ఓపెన్). ఈ డాక్యుమెంట్లో OCRని టెక్స్ట్కు అమలు చేయబోతున్నట్లు వర్డ్ మాకు చెబుతుంది:
మేము అంగీకరిస్తున్నాము మరియు కొన్ని సెకన్లలో వర్డ్లో ఇప్పటికే సవరించడానికి మా PDF తెరవబడిందని మేము చూస్తాము:
వాస్తవానికి, డిజైన్, స్టైల్స్, ఫాంట్లు, హెడర్లు మరియు ఫుటర్లు మొదలైనవి పత్రం నుండి పాక్షికంగా ఎగిరిపోతాయి, కానీ ఇది మాకు ముఖ్యమైనది కాదు - మాకు పట్టికల నుండి డేటా మాత్రమే అవసరం. సూత్రప్రాయంగా, ఈ దశలో, గుర్తించబడిన పత్రం నుండి పట్టికను వర్డ్లోకి కాపీ చేసి, ఎక్సెల్లో అతికించడానికి ఇది ఇప్పటికే ఉత్సాహం కలిగిస్తుంది. కొన్నిసార్లు ఇది పనిచేస్తుంది, కానీ చాలా తరచుగా ఇది అన్ని రకాల డేటా వక్రీకరణలకు దారి తీస్తుంది - ఉదాహరణకు, సంఖ్యలు తేదీలుగా మారవచ్చు లేదా టెక్స్ట్గా మిగిలిపోతాయి, ఎందుకంటే మన విషయంలో. PDF నాన్-సెపరేటర్లను ఉపయోగిస్తుంది:
కాబట్టి మూలలను కత్తిరించవద్దు, కానీ ప్రతిదీ కొంచెం క్లిష్టంగా చేయండి, కానీ సరైనది.
దశ 2: పత్రాన్ని వెబ్ పేజీగా సేవ్ చేయండి
అందుకున్న డేటాను Excel (పవర్ క్వెరీ ద్వారా) లోకి లోడ్ చేయడానికి, వర్డ్లోని మా పత్రాన్ని వెబ్ పేజీ ఆకృతిలో సేవ్ చేయాలి - ఈ ఫార్మాట్, ఈ సందర్భంలో, Word మరియు Excel మధ్య ఒక రకమైన సాధారణ హారం.
దీన్ని చేయడానికి, మెనుకి వెళ్లండి ఫైల్ - ఇలా సేవ్ చేయండి (ఫైల్ - ఇలా సేవ్ చేయండి) లేదా కీని నొక్కండి F12 కీబోర్డ్లో మరియు తెరుచుకునే విండోలో, ఫైల్ రకాన్ని ఎంచుకోండి ఒక ఫైల్లో వెబ్ పేజీ (వెబ్పేజీ — సింగిల్ ఫైల్):
సేవ్ చేసిన తర్వాత, మీరు mhtml పొడిగింపుతో ఫైల్ను పొందాలి (మీకు ఎక్స్ప్లోరర్లో ఫైల్ పొడిగింపులు కనిపిస్తే).
స్టేజ్ 3. పవర్ క్వెరీ ద్వారా ఫైల్ని Excelకి అప్లోడ్ చేస్తోంది
మీరు సృష్టించిన MHTML ఫైల్ను ఎక్సెల్లో నేరుగా తెరవవచ్చు, అయితే మొదట, మేము PDF యొక్క అన్ని కంటెంట్లను టెక్స్ట్ మరియు అనవసరమైన పట్టికల సమూహంతో ఒకేసారి పొందుతాము మరియు రెండవది, తప్పు కారణంగా డేటాను మళ్లీ కోల్పోతాము. వేరుచేసేవారు. కాబట్టి, పవర్ క్వెరీ యాడ్-ఇన్ ద్వారా మేము ఎక్సెల్లోకి దిగుమతి చేస్తాము. ఇది పూర్తిగా ఉచిత యాడ్-ఆన్, దీనితో మీరు దాదాపు ఏ మూలాన్నైనా (ఫైల్స్, ఫోల్డర్లు, డేటాబేస్లు, ERP సిస్టమ్లు) నుండి Excelకు డేటాను అప్లోడ్ చేయవచ్చు మరియు స్వీకరించిన డేటాను సాధ్యమయ్యే ప్రతి విధంగా మార్చవచ్చు, దానికి కావలసిన ఆకృతిని ఇస్తుంది.
మీకు Excel 2010-2013 ఉంటే, మీరు అధికారిక Microsoft వెబ్సైట్ నుండి పవర్ క్వెరీని డౌన్లోడ్ చేసుకోవచ్చు – ఇన్స్టాలేషన్ తర్వాత మీకు ట్యాబ్ కనిపిస్తుంది శక్తి ప్రశ్న. మీకు Excel 2016 లేదా కొత్తది ఉంటే, మీరు దేనినీ డౌన్లోడ్ చేయనవసరం లేదు - అన్ని కార్యాచరణలు డిఫాల్ట్గా ఇప్పటికే Excelలో నిర్మించబడ్డాయి మరియు ట్యాబ్లో ఉన్నాయి సమాచారం (తేదీ) సమూహంలో డౌన్లోడ్ చేసి మార్చండి (పొందండి & రూపాంతరం చెందండి).
కాబట్టి మేము ట్యాబ్కి వెళ్తాము సమాచారం, లేదా ట్యాబ్లో శక్తి ప్రశ్న మరియు జట్టును ఎంచుకోండి డేటా పొందడానికి or ప్రశ్నను సృష్టించండి – ఫైల్ నుండి – XML నుండి. XML ఫైల్లు మాత్రమే కాకుండా కనిపించేలా చేయడానికి, విండో దిగువ కుడి మూలలో ఉన్న డ్రాప్-డౌన్ జాబితాలోని ఫిల్టర్లను మార్చండి అన్ని ఫైళ్ళు (అన్ని ఫైల్లు) మరియు మా MHTML ఫైల్ను పేర్కొనండి:
దిగుమతి విజయవంతంగా పూర్తికాదని దయచేసి గమనించండి, ఎందుకంటే. పవర్ క్వెరీ మా నుండి XMLని ఆశిస్తోంది, కానీ వాస్తవానికి మనకు HTML ఫార్మాట్ ఉంది. అందువల్ల, కనిపించే తదుపరి విండోలో, మీరు పవర్ క్వెరీకి అపారమయిన ఫైల్పై కుడి-క్లిక్ చేసి, దాని ఆకృతిని పేర్కొనాలి:
ఆ తరువాత, ఫైల్ సరిగ్గా గుర్తించబడుతుంది మరియు అది కలిగి ఉన్న అన్ని పట్టికల జాబితాను మేము చూస్తాము:
మీరు డేటా కాలమ్లోని సెల్ల యొక్క తెలుపు నేపథ్యంలో (పదం టేబుల్లో కాదు!) ఎడమ మౌస్ బటన్ను క్లిక్ చేయడం ద్వారా పట్టికల కంటెంట్లను వీక్షించవచ్చు.
కావలసిన పట్టిక నిర్వచించబడినప్పుడు, ఆకుపచ్చ పదంపై క్లిక్ చేయండి టేబుల్ - మరియు మీరు దాని కంటెంట్లలోకి "పడిపోతారు":
దాని కంటెంట్లను "దువ్వెన" చేయడానికి కొన్ని సాధారణ దశలను చేయవలసి ఉంది, అవి:
- అనవసరమైన నిలువు వరుసలను తొలగించండి (కాలమ్ హెడర్పై కుడి క్లిక్ చేయండి - తొలగించు)
- చుక్కలను కామాలతో భర్తీ చేయండి (నిలువు వరుసలను ఎంచుకోండి, కుడి క్లిక్ చేయండి - విలువలను భర్తీ చేస్తోంది)
- హెడర్లోని సమాన సంకేతాలను తొలగించండి (నిలువు వరుసలను ఎంచుకోండి, కుడి క్లిక్ చేయండి - విలువలను భర్తీ చేస్తోంది)
- టాప్ లైన్ తొలగించండి (హోమ్ - పంక్తులను తొలగించండి - ఎగువ పంక్తులను తొలగించండి)
- ఖాళీ పంక్తులను తొలగించండి (హోమ్ - పంక్తులను తొలగించండి - ఖాళీ లైన్లను తొలగించండి)
- మొదటి వరుసను టేబుల్ హెడర్కి పెంచండి (హోమ్ - మొదటి పంక్తిని హెడ్డింగ్లుగా ఉపయోగించండి)
- ఫిల్టర్ని ఉపయోగించి అనవసరమైన డేటాను ఫిల్టర్ చేయండి
పట్టిక దాని సాధారణ రూపానికి తీసుకురాబడినప్పుడు, అది ఆదేశంతో షీట్లో అన్లోడ్ చేయబడుతుంది మూసివేయండి మరియు డౌన్లోడ్ చేయండి (మూసివేయి & లోడ్ చేయండి) on ముఖ్యమైన ట్యాబ్. మరియు మేము ఇప్పటికే పని చేయగల అటువంటి అందాన్ని పొందుతాము:
- పవర్ క్వెరీతో కాలమ్ను టేబుల్గా మార్చడం
- అంటుకునే వచనాన్ని నిలువు వరుసలుగా విభజించడం